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PRÓLOGO 


El presente libro es el producto de los apuntes de clases dictado en 
diversas instituciones de educación superior a lo largo de varios años, 
teniendo como pre-requisitos el curso de matemática básica. 


El objetivo de esta obra es presentar métodos y procedimientos para el 
análisis de datos cuando estos por su naturaleza presentan 
incertidumbre en la toma de decisión. 


El libro consta de 10 capítulos, acompañados de ejercicios resueltos y 
propuestos con la aplicación del SPSS. 


Esperamos que el presente texto de consulta sirva de guía al 
estudiante o investigador, para comprender los métodos que usa esta 
disciplina para analizar datos. 


LOS AUTORES 
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CAPÍTULO 1 


INTRODUCCIÓN 


Este primer CAPÍTULO tiene por objeto presentar algunos conceptos 
básicos de estadística, asi como de sumatorias simples y dobles los 
cuales se van a utilizar para una mejor comprensión de los capítulos 
siguientes. 


CONCEPTOS BÁSICOS DE ESTADÍSTICA Y SUMATORIAS 


1.1. 


ESTADÍSTICA 

Es una ciencia que proporciona métodos y procedimientos para 
el análisis de datos, cuando éstos por su naturaleza presenta 
incertidumbre en la toma de decisión. 

Otras definiciones: 


Es una matemática aplicada para el análisis de datos. 


Es el estudio de los fenómenos aleatorios. 


Es la ciencia que se encarga de la recolección, ordenamiento, 
representación, análisis e interpretación de datos generados en 
una investigación sobre hechos, individuos o grupos de los 
mismos, para deducir de ello conclusiones precisas O 
estimaciones futuras (Salazar, Castillo, 2018, p.13). 


RAMAS DE LA ESTADÍSTICA 

La estadística se divide en dos ramas: 

. ESTADÍSTICA DESCRIPTIVA 

Es parte de la estadística que consiste en la recolección, 
organización, presentación, análisis e interpretación de un 


conjunto de datos para una o más variables de interés del 
investigador. 
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Es la ciencia mediante la cual se recopila, organiza, presenta, 
analiza e interpreta datos de manera informativa tal que describa 
fácil y rápidamente las características esenciales de dichos datos 
mediante el empleo de diversos métodos gráficos, tabulares o 
numéricos, etc. (Suarez, 2018, p.13). 


. ESTADÍSTICA INFERENCIAL 


Es parte de la estadística que se encarga en tomar decisiones 
sobre el comportamiento de una variable de interés definida en la 
población en estudio; utilizando para tal objetivo una muestra al 
azar. Es decir a partir de los resultados obtenidos al procesar los 
datos de una muestra, se generaliza los resultados de dicha 
variable en la población, con un cierto riesgo que es medido por 
la teoría de la probabilidad. La estadística interencial proporciona 
métodos y procedimientos para el análisis de datos. 


Llamada también inferencia estadística, la cual consiste en llegar 
a obtener conclusiones o generalizaciones de la población a 
partir de una muestra de ella, es decir, emplea métodos para 
buscar información que permita determinar propiedades de la 
población basándose en el estudio de los datos de una muestra 
tomada a partir de ella (Suarez, 2018, p.13), 


CONCEPTOS BÁSICOS 
1.3.1. Población 


Es la totalidad de unidades elementales (personas, 
animales u objetos) sujeto a estudio y que poseen una 
característica común; al tamaño de la población (número 
de unidades elementales) se simboliza con la letra 
mayúscula “N”. Una población en estudio puede ser finita 
(se pueden enumerar sus elementos) o infinita (no se 
pueden enumerar sus elementos). 


Ejemplos: 


a. Todas las tiendas que se dedican a la venta de gas en el 
distrito de la Molina (N = 650) 

b. Todos los establos de ganado vacuno en el departamento 
de Cajamarca (N =1,350) 
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1.3.2. 


1.3.3. 


Todos los Alumnos matriculados en el semestre 2000-11, 
en la UNMSM, 

Todos los Cadetes de la Escuela de Oficiales de la PNP, 
en proceso de formación. 

Todas las papeletas impuestas por la PNP, por infringir al 
Reglamento Nacional de Tránsito, durante el mes de 
diciembre de un año determinado (N = 2,520). 

Todos los usuarios que concurren a la Biblioteca de Letras 
y Ciencias Humanas de la UNMSM, un día cualquiera. (N 
= 1,742) 

Todas las estrellas del universo. 


Unidad Elemental 


Es cada uno de los elementos que conforman la población 
en estudios, de la cual se requiere información. En una 
unidad elemental se definen muchas variables de interés 
para el investigador. 


Ejemplo 


De los ejemplos anteriores de poblaciones se tienen las 
siguientes unidades elementales: 


Una tienda que se dedican a la venta de gas en el distrito 
de la Molina. 

Un establo de ganado vacuno en el departamento de 
Cajamarca. 

Un alumno matriculado en el semestre 2000-11, en la 
UNMSM. 

Un Cadete de la Escuela de Oficiales de la PNP, en 
proceso de formación en el año 2004, 

Una papeleta impuesta por infringir al Reglamento 
Nacional de Tránsito impuestas por la Policía en el mes de 
Setiembre. 

Un usuario que concurre a la Biblioteca de Letras y 
Ciencias Humanas de la UNMSM, un día cualquiera. 

Una estrella del universo. 


Dato u observación 


Es el valor (atributo, conteo o medición) que toma la 
variable de interés en la unidad elemental. 
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Los valores que toma una variable en particular X, se 
representan con letras minúsculas acompañadas por 
subíndice; es decir, 


X= Lx1, 0 Jn 
X; = valor que toma la variable X en la ¡-ésima observación 


1.3.4. Variable 


Es una característica de interés que se desea estudiar en 
la unidad elemental. La variable en estudios la fija el 
investigador; el valor que toma la variable (dato u 
observación) cambia de unidad elemental a otra. A una 
variable se le simboliza con las últimas letras del 
abecedario, tales como X, Y, Z, O también letras 
mayúsculas acompañada con subíndice, tales como: 


Xi 2 gus A 


Ejemplos de variables en estudio: 


1.7. X= Montos(S/.) por venta diaria de contenidos de balones de 

gas. 

Y = Numero de ganado vacuno por establos 

Z = Color de los ojos de los Cadetes de la EO-PNP 

0. W= Volumen (cm?) de contenido de liquido de una botella. 

1. T =Tiempo (minutos) que permanece un usuario en un cajero 
automático. 


138 
1.9 
1.1 
1.1 


1.3.5. Tipos de variables: 


De acuerdo a los valores que toma la variable en estudio, se 
clasifican en: 


. Variable Cualitativa 


Cuando los valores que toma la variable en estudio provienen 
de una cualidad o atributo, se divide a su vez en nominal y 
jerárquica (ordinal). 
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. Variable Cualitativa Nominal. 


Una variable se considera cualitativa nominal, cuando con los 
valores que toma esta variable no es posible establecer un 
orden de acuerdo a su importancia. 


Ejemplos: 


a. X = Color de los ojos de los alumnos de la Facultad de 
Letras y Ciencias Humanas de la Universidad Nacional 
Mayor de San Marcos (marrones, pardos, verdes, 
negros,...) 

b. Y = Preferencias a determinadas marcas de jabones de 
tocador por las alumnas de la facultad de Letras y 
Ciencias Humanas de la Universidad Nacional Mayor de 
San Marcos. 

C: Z = Sexo de los Cadetes de la EO-PNP. 


o Variable Cualitativa Jerárquica u Ordinal 


Una variable se considera cualitativa jerárquica u ordinal, 
cuando con los valores que toma la variable en estudio es 
posible establecer un orden de acuerdo a su importancia 
(ascendentemente o descendentemente) 


Ejemplos: 
a. X = Grados Académicos de los docentes de la Facultad de 


Ingeniería de Sistema de la Universidad Nacional Mayor 
de San Marcos: bachiller, magíster, doctor, Ph.D. 

b. Y = Grados del personal de Oficiales de la Policía Nacional 
del Perú: Teniente General, General, Coronel, 
Comandante, Mayor, Capitán, Teniente, Alférez. 

Cu Z = Clase social: alta, media, baja 


. Variable cuantitativa 
Los valores que toma la variable provienen de un conteo o de 
una medición (insttumento de medida: metro, balanza, 
cronómetro, termómetro, etc.); se divide a su vez en: 


. Variable cuantitativa Discreta 


Una variable se considera cuantitativa discreta cuando los 
valores que toma la variable provienen de un conteo. También 
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gp 


se dice que los valores que toma esta variable están asociados 
a los números enteros. 


Ejemplos: 
Y = Número de hijos por familia. 
Z = Número de alumnos matriculados por cursos, en la 
Universidad 
Nacional Mayor de San Marcos en el ll-Semestre 
2003. 


W =Número de accidentes de tránsitos registrados 
diariamente en el distrito de Miraflores, durante una 
semana cualquiera. 


T = Número de artículos publicados en las revistas 
científicas de biología, durante los últimos 10 
años. 


P= Número de veces que frecuentan los usuarios durante 
la semana a la biblioteca Central de la UNMSM 


Variable cuantitativa continua 


Una variable se considera cuantitativa continua, cuando los 
valores que toma la variable provienen de una medición; es 
decir, los valores que toma se encuentran en un intervalo. 
También se dice que los valores que toma esta variable están 
asociados a los números reales. 


Ejemplos: 
X = Montos (S/.) por ventas diarias por los grifos en el 
distrito de la Molina. 
Y = Edad (años) de los alumnos matriculados en el 
Semestre Académico 2004-11 en la Universidad Nacional 
Mayor de San Marcos. 
Z = Tiempo de vida (horas) de baterías para automóviles. 
Y = Estatura (mts) de los Cadetes de la EO-PNP. 
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VARIABLES CATEGÓRICAS VARIABLES NUMÉRICAS 
Naturaleza CUALITATIVAS CUANTITATIVAS 
Escala NOMINAL ORDINAL INTERVALO RAZÓN 
Ejemplos Género Estado Civil Instrucción Intensidad Temperatura Hora del día Peso Hijos 
Soltero Primaria Leve -10%C 00 Horas 00.00Kg Uno 
Masculino 
Casado Secundaria Moderado oc 10 Horas 10.24Kg Dos 
Femenino 
Conviviente Superior Severo 20% 20 Horas 20.00Kg Tres 
Dicotómicas: Tienen solamente dos categorías Continuas: Provienen de medir 
Ejemplos de Ordinal Dicotómica: Se pueden representar con números enteros o fraccionarios 
Nuevo - Continuador Entre dos valores siempre existe un valor intermedio 
Observaciones 
Vivo — Fallecido 
Sano — Enfermo Discretas: Provienen de contar 
Politómicas: Tienen más de dos categorías. Solamente pueden ser representados con números enteros 


Fuente: Apuntes de clase Supo(2020) 
1.3.6. Muestra 


Es una parte de la población en estudio o también se dice 
que es un subconjunto de unidades elementales de la 
población. Al tamaño de la muestra se le representa con la 
letra minúscula *n”. Se dice que una muestra es aleatoria o 
al azar, cuando todos los elementos de la población tienen 
la misma probabilidad de ser parte de la muestra. 


Muestreo, es el procedimiento para obtener una muestra 
representativa de la población en estudio. 


1.3.7. Parámetro 


Es un valor fijo que caracteriza a la variable de interés en la 
población en estudio. Para calcular este valor se requiere 
conocer todos los datos de la variable en la población; por 
lo general este valor casi nunca se conoce el objetivo de 
investigador es estimarlo a través de una muestra 
aleatoria. 


Los parámetros más utilizados son: 


_ 


La media aritmética poblacional (UL) 


N 


La mediana poblacional (Me) 
3. La moda Poblacional (Mo) 
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SSL 0 NL DM ¿ON 


o 


La media Geométrica Poblacional (U G) 

La media Armónica Poblacional (U 4) 

La variancia Poblacional (0 ? ) 

La desviación Estándar Poblacional (O ) 

El coeficiente de variación Poblacional (CV >) 
La proporción Poblacional (P) 

El rango poblacional (R) 


1.3.8. Valor Estadístico o estimado. 


Es un valor calculado con los datos de la muestra aleatoria 
y se supone estima al valor del parámetro de la variable en 
estudio en la población. Este valor cambia de una muestra 
a otra muestra. La fórmula que permite calcular el valor 
estadístico recibe el nombre de estimador o estadística. 


Los valores estadísticos más utilizados son: 


a. 
b. 


Cc. 


d. 
e 


> “0 


La media aritmética muestral (1) 
La mediana muestral (m. ) 


La moda muestral (mo) 


La media geométrica muestral (x ¿) 


La media armónica muestral (x,) 


La variancia muestral (s?) 

La desviación estándar muestral (s) 

El coeficiente de variación muestral (cv) 
La proporción muestral ( p) 

El rango muestral (r ) 


1.4. Ejercicios resueltos 


Ejemplo-1 


En Lima Metropolitana se toma una muestra aleatoria de 30 grifos que 
se dedican a la venta de combustible de un día determinado, se obtiene 
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que el monto por venta promedio es de S/. 12,600.50. Con esta 
información identificar: población, unidad elemental, variable en 
estudio, tipo de variable, un posible dato, tamaño de la muestra, 
parámetro y valor estadístico. 


Solución: 
Población : Todos los grifos de Lima 
Metropolitana, que 

se dedican a la venta de 
combustible. 
Unidad elemental : Cada grifo de Lima 
Metropolitana que se 

dedica a la venta de 


combustible 

Variable en estudio E Monto por venta(S/.) diaria de 
combustible 

Tipo de variable : Variable cuantitativa continua 
Dato u observación : S/12,400.30 

Tamaño de la muestra : 30 grifos 

Parámetro : No se conoce el monto 


promedio por venta diaria 
en la población. 
Valor estadístico : S/.12,600.50, venta promedio 
en la muestra. 
Ejemplo-2 
De una población de 2,042 revistas científicas de biología, el 73.46% 
están escritas en idioma inglés. Una muestra aleatoria de 50 revistas 
arroja que el 72.0% están escritas en inglés; el promedio de artículos 
por revistas es de 12.4. Con esta información identificar: población, 
unidad elemental, variables en estudios, tipos de variables, posibles 
datos, tamaño de la muestra, parámetro y estimado o valor estadístico. 


Solución: 

Población : Todas las revistas científicas 

de biología 
N = 2,042. 

Unidad elemental ] Cada revista científica de 
biología. 

Tamaño de la muestra ] 50 revistas científicas de 
biología 
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Variables Tipos de Datos u Valor 
enestudi amaplós observacion | Parámetro estadístico 
es o estimado 
: Español, 5 72.0%, 
Iamarea Cualitativa | ingles, no están en 
las revistas Ñ E están en idi 
científicas ppp! portugués, idioma ingles la 
etc. ingles 
12.4 
os Cuantitativ | 12,16, 11, | Se elas 
por revistas a discreta | 9, etc. desconoce deamiculos 
por revistas 


1.5. 


Ejercicios propuestos 


En cada uno de los siguientes enunciados identificar de ser posible: la 
población, unidad elemental, variables en estudio, tipos de variables, 
tamaño de la muestra, valores estadísticos, parámetros y un ejemplo 
de posibles datos en cada caso: 


fl. 


Una muestra al azar de 50 recién nacidos en la maternidad de 
Lima arroja un peso promedio de 3.50 Kg; el 46% son varones y 
70% tuvieron parto normal. 

Una muestra aleatoria de 550 peruanos mayores de 18 años 
arroja la siguiente información: la edad promedio es 32 
años;20% tienen grado de instrucción superior y 30% está de 
acuerdo con las medidas económicas anunciadas por el 
gobierno hace unos días. 

Para analizar la posibilidad de lanzar al mercado una nueva 
marca de cigarrillos, se efectuó una encuesta entre fumadores 
que transitaron por la quinta cuadra de la avenida Canadá entre 
las 5 p.m. y 8 p.m. del día 14 de febrero; para ello se seleccionó 
en forma aleatoria a 80 fumadores, obteniéndose los siguientes 
resultados: el 25 % prefiere los cigarrillos importados que los 
nacionales y el precio promedio que pagan al comprar una 
cajetilla es de S/. 3.40. 

Una muestra aleatoria de 100 microbuses de transporte urbano 
en Lima metropolitana a las 12.00 horas de un día cualquiera, 
arroja que el promedio de pasajeros dentro del microbús es de 
18.4 personas; el 75% de los microbuses tienen más de 10 años 
de antigúedad. 

Una muestra aleatoria de 50 frascos conteniendo mermelada 
arroja un peso promedio de 45.3 grs. Y una desviación estándar 
de 5.436 grs. Si la producción diaria de la planta es de 5,000 
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frascos con un peso promedio de 45.5 grs y una desviación 
estándar de 5.5 grs. 

6. El porcentaje de varones de un centro educativo es de 62.5%; 
una muestra aleatoria de 50 alumnos arroja que 58% son 
varones; la edad promedio es de 15.4 años; el promedio de 
hermanos es de 2.3 y el 60% tienen casa propia. 

7. Una muestra aleatoria de 70 usuarios que concurren a un centro 
de información arroja que el 34.3% son del sexo masculino. De 
experiencias pasadas se sabe que el porcentaje de varones que 
concurren fue de 34.2%. 

8. Una muestra aleatoria de 20 revistas científicas sobre Biología 
arroja que el promedio de artículos publicados es de 13.3; el 
70% están escritos en inglés; el 15% son de nacionalidad 
Argentina. 

9. De una población de 1,200 actas de sustentación en 
Matemáticas Pura, el 72% obtuvo el calificativo de bueno al 
sustentarlo. Una muestra aleatoria de 25 actas arroja que el 76% 
de actas obtuvieron el calificativo de bueno. 

10. Una muestra al azar de 65 Cadetes de la Escuela de Oficiales de 
la Policía Nacional del Perú arroja los siguientes resultados: El 
78.4% son de sexo masculino; el 32% cursa el 2do año 
académico; el 80% provienen de colegios particulares; el gasto 
promedio semanal en los cafetines es de 30.4 nuevos soles; el 
promedio de hermanos es de 2.4; la edad promedio es de 23.4 
años y su estatura promedio es de 1.69 mts. 

11. —Una muestra al azar de O estudiante de la Facultad de letras y 
ciencias Humanas de la UNMSM arroja la siguiente información: 
el 30% tienen edades superiores a los 30 años; el 52% son de 
sexo masculino; el promedio de créditos matriculados es de 
21.4; la edad promedio es de 23.3 años; el promedio de cursos 
llevados es de 5.2; el 32% de sus profesores tienen grado de 
Magister. 


1.6. ETAPAS DEL MÉTODO ESTADÍSTICO 
La estadística, proporciona métodos y procedimientos que 
permiten analizar datos de variables de interés, utilizando para tal 
fin una muestra elegida al azar de la población en estudio; con el 
objetivo de tomar decisiones en dicha población. Para su 
aplicación, se debe tener en cuenta las siguientes etapas: 


1.6.1. Planteamiento del problema. 
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1.6.2. 


1.6.3. 


1.6.4. 


1.6.5. 


1.6.6. 


1.6.7. 


1.6.8. 


1.6.9. 


Debe plantearse con precisión y claridad la necesidad 
que se desea conocer, las causas de la investigación. 


Objetivo 
Conjunto de acciones o tareas de las necesidades 
alcanzadas, debe plantearse un objetivo general y 
como mínimo tres objetivos específicos. 


Determinación de la unidad de investigación 
Corresponde al elemento de la población, que puede 
ser persona, animal u objeto, de la cual se definen 
variable de interés para el investigador. 


Formulación de hipótesis 
Son supuestos que se plantea en la población con 
respecto a la distribución o parámetro de la variable de 
interés, estos pueden ser rechazado o no, utilizando 
para tal propósito una muestra aleatoria. 


Selección del método de investigación 
La investigación puede ser exploratorio, descriptivo, 
correlacional, etc. 


Recopilación de datos. 
Corresponde a la recolección de datos. Esta puede ser 
por observación directa, por encuesta, por 
publicaciones y/o fuentes externas confiables. El éxito 
de toda investigación depende en gran parte de la 
consistencia de los datos obtenidos. 


Procesamiento de los datos 
Corresponde a obtener tablas, gráficos o valores 
estadísticos, en la actualidad se usan software tales: 
Excel, Minitab, SPSS, SAS, etc. 


Publicación 
Se consigna los resultados de la investigación, previa 
revisión de los datos procesados. 


Generalización e inferencia estadística. 


Las conclusiones de la investigación son generalizadas 
a la población de donde se obtuvo la muestra aleatoria. 
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1.7. SUMATORIAS SIMPLES, DOBLES Y NOTACIÓN PUNTUAL 


1.7.1. SUMATORIAS SIMPLES 


Sea X, una variable cuantitativa en estudio que toma valores 


Ml XFX) Pros PX, 


», la suma de los valores se 


n 
LX 
representa mediante el operador matemático *! que significa 


nn." 


DA 
sumar todos los valores “*, para "¡" que toma valores enteros 
positivos consecutivos desde 1 hasta n; es decir: 
n 


X1 + X2 +,...,FXn = Y y, 
El 


Donde: 


X;¡= Valor que toma la variable X , en la i-ésima observación 


Ejemplos: 


1. Desarrollar de las siguientes sumatorias 
po] 


2 Xoi+1 == X3+ X5+ aia Y X11 
13 


sl Yom y3 ys Yo 


Y (a, == (51 TP + (a M4 o. + (a — DP 


tl 


2. Supongamos que una variable X , toma los siguientes valores: 


a=l =9 => Xx =606 
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3. 


49x?+3 
1 
Calcular: 


E 
42243 212+3 2x2+3 2x2+3 21? +3 
Lo Dd, 2,05,0s 
ld == x1-2 x-2 x3-2 x4- 2 


122x243 2AT?+3 207+3 25)+3 2(6) +3 


E io hs e + 


il x 2 de 92 S —2 6=2 


rTt+3 
SE 20.2+23.57+17.67+18.75=80.19 
¿Er Xx 2 
Supongamos que una variable X toma los siguientes valores: 
a=-2 xm=l m=4 x.0=3 
4 


Calcular: Nx; +2 


El 


4 


A E EA 


i=l 


yq +2) =(-2 + 2 + (1 + 2) + (4 +2) + (3 + 2)? = 38 


El 


Calcular: Y (2x, +30) 


i=1 
4 


xi +3) 7) = Qxa1 +3)6001 7) +(x2 +3) — 7)... + Qxa + 3 )(x4 —7) 
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yn (Qxi +3)(% 7) = Q2) + 3122) - 7) + QU) + 310) 7)... + Q(8) +3)1(6) 7) 


4 
Y (2x, +3), -7) =-2 
i=l 
De otra forma 


En una tabla establecer varias columnas, la primera para el 
subíndice que toma la variable, la segunda para los valores que 


toma la variable X , la tercera para el primer factor, la cuarta 
para el segundo factor y la quinta para el producto de los dos 
factores, luego para la tercera y cuarta columna se calculan los 
valores numéricos para cada valor de la variable y para la quinta 
el producto de los valores obtenidos en los pasos anteriores, y la 
suma de estos valores es el resultado pedido. 


Llx 1 2x+3 1 x-7 | Ox+3)lG- 7) 
1 2 -1 -9 9 
5 5 6 -30 
314 5 11 55 
4 | 3 9 -4 -36 

-2 


4 


Es decir: OA +3 =7)=9%=30+35-36==2 
El 


PROPIEDADES DE LAS SUMATORIAS SIMPLES 


iza 


Sea la sumatoria: 


mer 


Siendo a y b números enteros (a < b) , y el subíndice 1" que 
toma valores enteros consecutivos desde “a” hasta “b”, donde: el 
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valor de “a” es el límite inferior y “b” es el límite superior de la 
sumatoria. Teniendo en cuenta la definición de sumatoria, se 
tienen las siguientes propiedades matemáticas: 


l. El número de términos o sumandos de una sumatoria es 
igual al limite superior menos el limite inferior más la 
unidad; es decir, 


N'Términos =b-—a-+l 


li La sumatoria de un valor constante, es igual a la constante 
multiplicada por el número de términos de la sumatoria; es 


decir, sea x,=m  Vi=a, a+l1,a+2,..., b, entonces: 


m=m(b=a+l) 


i=a 
Siendo: M la constante 


lil. La sumatoria de una constante multiplicada por una 
variable, es igual a la constante por la sumatoria de la 
variable; es decir: 


b b 
y mx; = md x, 
iza iza 


Siendo: M la constante 


Xi=MyiF pzik q la 


iv. Sea la combinación lineal 
: Xx, ; 
sumatoria de los “¿para ¡=a, a+1,a+2,..., b.,es 


gua E b l 
2 = my, + pzi +q) =D, yi pu Hq(b-a+l) 


iza ia iza 


Siendo: A, P,4 constantes 
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1.7.2. SUMATORIAS DOBLES 


Sea X , una variable en estudio, cuyo valor es el resultado de 
observar simultáneamente dos características a una unidad 
ij 

elemental, valor que toma doble subíndice , representa el 
valor que toma la variable X en la ¡ = ésima fila (primera 
variable) y la  ¡= ésima columna(segunda variable), por lo 
tanto si se tiene “a” filas y “b” columnas, la suma total de los 
valores de la arabe X se puede representar por la doble 


sumatoria; es decir, 
22% X, 


i=lj= 
Ejemplo: desarrollar 


3 
ye xy) = y X¡¡+ y Aa ii de de 
i=lj= j= Lp Al E] desarrollando ¿el subindice " ¡" 


desarrollando ¿el subindice "i" 


PROPIEDADES DE LAS SUMATORIAS DOBLES 


Sea la sumatoria doble: 


22% 


iza j¡=cC 


Siendo 4,b,c,d números enteros positivos, y los subíndices 
“1”, Y” toma valores consecutivos desde “a” hasta “b” y desde *c” 
pa “d” respectivamente; los valores “a” y “c” son los límites 
inferiores, y “b” y “d” son los límites superiores de la doble 


sumatoria. 
Teniendo en cuenta la definición de sumatoria doble, se tienen 


las siguientes propiedades matemáticas: 


Í. El número de términos de una doble sumatoria es igual al 
producto del número de términos de la primera sumatoria 
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con el número de términos de la segunda sumatoria; es 
decir: 


N* Tér min os =(b-=a+1Xd-c+1) 


La doble sumatoria de una constante, es igual a la 
constante multiplicada por el mee términos de la 


X= M, y 
sumatoria; es decir, sea , entonces: 
bd 
Y) Y) m=mb-a+ 1Xd=c+1) 
iza j =c 


Siendo: M la constante 


La doble sumatoria de una constante multiplicada por una 
variable, es igual a la constante por la doble sumatoria de 
la variable; es decir: 


bd bd 
mx, =P Y xy 

iza ¡=c i=za j¡=c 
Siendo: M la constante 


X= nyE pz; + q 


Sea la combinación lineal , la doble 


. Xi; . 
sumatoria de los ”, es igual a: 


b b b bd 


d b d b d 
SS xi == SN my; + pz +q)= DI Yi E Py zi E q(b=a+1 Xd —-c+1) 


i=aj=e i=aj=e i=aj=c i=aj=e 


Siendo: 24, P, G constantes 
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1.7.3. NOTACIÓN PUNTUAL PARA UNA SUMATORIA DOBLE 


Sea la tabla de doble entrada (conocida como tabla de contingencia) 


A 
1 2 3 e k Total 
no 
1 X1 X1 X13 Xx Xy 
2 Xo1 Xoo X23 Xx X, 
3 X31 Xy X33 X3g X 
E 0 e de di ed Y, 
Total 0 es da cds Xx, x 


De la tabla la suma de los elementos de la primera columna 
s 

X11 + X21 + X3105 0... + Xr1 = e Xi1 ; al valor de la sumatoria e Xil se 
i=1 El 


le representa mediante la siguiente notación puntual A, ;es decir, 
> 
ya X= Xp 
i=l 


X1= corresponde a la sumatoria simple de todos los elementos Xi, 


no.” 


para “1” que toma valores desde 1 hasta r, de la primera columna. 
De la tabla la suma de todos los elementos de la 1ra fila 
k 
X11 + X12 + X134 0.4 M1 = 2 Xp; 1 (Corresponde a la sumatoria 
j= 


simple de todos los elementos Xi, para” /. que toma valores desde 


1 hasta k, de la primera fila) 
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También de la tabla 


r  k r 
22 2 2 =X 
El 


i=l ¡=1 
1.8. Ejercicios resueltos 


50 


50 50 
1. Senm»x=20 y Y, += 100 hallar: > 3x,-4Y 
El E El 
Solución 


Y (3% -4), 7 (91, -24x +16) = D'9x, - Y'24x + )16= 
il El i i i i 


El El El 


50 50 


=9) x? - 24) xi + 16(50—1 +1) =9(100) — 24(20) + 16(50) = 1220 
El El 


2. Pp Y 


Cásri+ ss? (ui +DA +2) +3) +4) 
El El 

Solución 

Y? +5 + 5) Da + DG + 2)X(x, +3)(x, +4) 


2 + sx + ya, + D)(x, + 4)(x, + 2)(x, + 3) 


Var 5x +5) Dr óx +4)02+5x +6) (1) 
sl 1 1 4 1 1 1 1 


Supongamos que y + Sx luego reemplazando en (1) se tiene 


i 
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n 


04d y 0 +01 +0 = 710, +91 +90 +03 


El 


A+ o - 24 + PDl)= -+ 


(y, 10y, 25) (y, 10y, 24) 1 m1 Don 


3. Simplificar 
a b 

JNE —=X,— Xx, +x,) 
i=l ¿sl 


Solución 


S Y (x5 EE e a 


y Y e - Sy x= SY on SS 


=l j=1 =l ¡=1 ¡=l ¡=1 =l j¡=1 


= Xx py, X; — ay, A EADX, 


-x bx -— ax +abx =(1- aJd - bx 


n 


4. Sean: PR = 100 y y x; = 3, Calcular el valor 
i=1 


i=l 
n 2 
20 10) 
de : 
Y 


Desarrollando el numerador de la sumatoria y aplicando las 
propiedades: 
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"(x —20x +100)= "x -20”x 


-10) * = 
NE O 


El El 


2 ? 2 ¡ +100n =100-— 20(5) + 


El El 


100n 
Luego se tiene que: = 100 
n 

BD. De la tabla 
l Xi Yi 
1 4 5 
2 5 6 
3 2 -4 
4 3 5 
5 2 7 


Calcular el valor de : Y? 2(7x2—5 y3 )? 


El 
Y 2(7x2-5 y 2 =2) (73 2-5 y)? 


il El 


De la tabla 
lr] 7 5: 7e-Sy | (1x2 -5y 7) 
1 4. 5 112| 625 -513 263169 
2 51 6 175| 1080 -905 819025 
3 21 4 28| -320 348 121104 
4 31 5 63. 625 -562 315844 
S a 7 28| 1715 -1687 2845969 

Suma 4365111 


NAT 5 y Y =2(4:365,111) =8'730,222 


i=1 
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1.9. Ejercicios Propuestos: 


De la tabla que se presenta a continuación: 


k 1 2 3 4 5 
Xk 2 1 0 3 1 
Calcular: 


E) 
1 D)i(S+3u)” 
k=1 


Soo 


sale? =X + 1) 


2. Xx 
; ds 1 
AN E y 
3 Mi (a (Xx, +] donde El 
5 
Ox -4)Sx1 +4) 
4. > 
[Es Y 
E. 42 e , 
lia 
5 5 
6. Pr 5) (a +5) 
k=1 k=1 
7. De la información dada en la tabla, si a cada valor se le 


incrementa en un 40% más 3 unidades. Hallar la suma de los 
cuadrados de los nuevos valores. 


Dada las siguientes expresiones simplificar: 
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" Ñ a 
8 y Xi x) z ¡siendo x= 
=l n 


9 e xxi do (x, a 


. , siendo 
¡=l = 


10. 2% - DO Ss y) E nxy 


yA _ 2) 


_ 
n Y =p 


11. Sea J¡=0X,FC para 1= ¡A 


n 
calcular el valor de y Y; — yy 


El 


5 5 
12. Sea (um -3P?=18 donde x,=7 
il i=1 
Y +3) 
Calcular el valor de i 
¡=1 
5 
0 
13. Sea 0 +5) = 200 , calcular el valor de 
il 
Y 
5 Ze “a 
— Y + ¡=1 — 
(x X) donde X= ' 1 
l= y 


Sean X e Y dos variables que toman valores tal como se presenta en la 
tabla. 
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l 1 2 3 4 5 
di 1.65 1.70 1.75 1.80 1.85 
Yi 60 65 70 78 80 
Calcular: 
14.5 (2x,+ y ), 
El 5 
24 
] sE ES e = él 
15.) (200 +01 y) 11 $, siendo x=, 
El 
5 
_ Py 
y= SS 
5 _ _ 5 
0 =D); — y) ye e Y; 
18.2 siendo —_ .,, dias El 
3 — x= 5 y 5 


17. Y [xi y 


E 


3%, 


Se y, 


5 a 5 eE 
18. 2 (iy) 220%) , siendo ye 


3 


19. 


¡z=l5 y 


El 
s 1 yy i 
=1 


L 
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ES 


Da 
Calcular el valor de “M” en: S (x, => M) NN 10 Siendo: 
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Dada la siguiente tabla de doble entrada con valores Xi 
1 2 3 4 
1 2 1 0 0 
2 4 1 2 3 
3 0 2 0 1 
Calcular las siguientes sumatorias: 
0. Dz y 
i=1¡=1 
Y (? + Y Y +x) 
pa j A 
A ja 
Y (x, + 2yY 
22, ¿A 
3 4 
22%)” 
2. AA 
NY a+? 12 +24x ) 
j it j 
24. A 
Y (xi+ 2) = Sn 
25.  Seala siguiente ecuación +! , Hallar en valor 
de: 
yal 
26. 


n 
Hallar la suma de los coeficientes al desarrollar: 
5 


S (3x; EN S yi > 


El 
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27.  Simplificar 


n+1 n n 
PR A 


En un asiento minero de Cerro de Pasco, para un mes determinado, la 
administración hace la distribución del personal de ingenieros por turno 
y modalidad de trabajo, tal como se presenta en la tabla: 


Tajo Al e 
Abiério ei Socavón = 2 Seguridad = 3 
Turno =1 16 20 2 
Turno =2 30 40 2 
Turno =3 0 70 4 


Donde X ij= corresponde al número de ingenieros para el ¡-ésima turno 
en la j-ésima modalidad de trabajo. Para cada caso expresar por 
sumatoria y calcular su valor: 

28. Total de ingenieros que laboran en el 1er. Y 3er turno, para 
todas las modalidades. 

29. Total de ingenieros que laboran en el ter. Y 3er. Turno, para las 
modalidades de trabajo: tajo abierto y seguridad. 

30. Si los ingenieros del 1er. Turno ganan “b-a” nuevos soles, para 
los del 2do. Turno “b” nuevos soles y para los del tercero “b+a” 
nuevos soles. Cual es el total a pagar por la administración en 
ese mes. 


31.  Simplificar 
ar + 13x +41) Nr + 5)(0+6)(0+ Tx +8) 
a ? El 
32.  Simplificar 


y O yx 31 ) 


¡=l ¡=1 i=l j=1 
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p b 
2% yy j 


Donde: xy = i=1 y= 
E y Y ñ 


33.  Simplificar 
Na t+ 52 +5 - (a? + 1962 + 2)(0? + 3)(x? + 4) 
e i i e 1 i 1 1 
34. — Simplificar 


n+1 


Y (0x0 — Dn 29? 


35. — Simplificar 


e + ay -— PS a ay 


36.  Simplificar 
2 3 


A +5x , —2x, —2x,,) 


¡=1¡=1 


37. Simplificar 


2 y 1.) Se, E 


¡=lj=l i=l1j=1 


38.  Simplificar O o 
YY, 
i=l ¿Al i=l ¿al 
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39. Simplificar 
YY, 031, EDO, Mm 
i=l j=l i=l j=l 
X; » X, >-===X100 
40. Sea , Una muestra de 100 datos, cuya suma de 


sus valores es igual a 400. Si a cada dato se le incrementa en 
5% de su valor más la unidad, calcular la nueva suma. 


41. — Simplificar 


a 


o (x- x)x= a b Y -— En Ñ xy 


a y 2 a 


i=1¡=1 i=1¡=1 i=1¡=1 


42. — Simplificar 
a 


PAE Fa Xy FX ¿+X,) 


¡=l ¡=1 
43. Sim ica > ls 
p x)+ a ( b X y 
+ >, 
¡=1 =l bia ja 


44. — Simplificar 
11 


12 12 


SY (x, +1D)x, Y (x, + 4)6,, -3)+ 20% +16 =11) 


El El 


45. — Simplificar 
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X¡7 X 


46.Sea 


Ax - xy 


El 


Calcular el valor de : 


n 
2 W;Xi 
i=1 


La Empresa de transporte San Francisco S.A, cuenta con 4 
vehículos cuya ruta comprende los distritos del Callao con la Molina. 
Se define a la variable en estudio Xij= Numero de boletos 
entregados a los usuarios en el i-ésimo vehículo para el j-ésimo 
turno, tal como se presenta en el siguiente cuadro: 


Vehículos 
Vehículo=1 | Vehículo=2 | Vehículo=3 | Vehículo=4 
Turnos 
Turno=1 400 500 600 600 
Turno=2 300 400 400 300 
Turno=3 400 400 400 400 


Expresar mediante sumatorias y calcular su valor 


para todos los vehículos de la empresa. 


El Total de boletos expedidos a los usuarios del ter y 3er turno 


Si el precio para el tercer turno es el doble del precio del 2do y el 


precio del primer turno es la mitad del 2do turno, siendo el precio 


46. 
47. 
del 2do turno igual a 
48. 
vehículo. 
49. ¡Simplificar 


nuevos soles. 
El total de boletos expedidos por los tres turnos para el 1ro y 4to 


NY =D0,- Y)Z; — no —X)Y ¿, siendo: 


A 


2% 


Si 


¡=1 


y? 


n 


» 


i=l 
Y 


Z= 
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A . Mis 
50. Dada la siguiente tabla con valores Y = Valor que toma la 
variable X en la ¡-ésima fila y j-ésima columna. 


Pl, E 3 
l 
1 2 1 2 
2 3 2 0 
3 2 2 3 
4 4 1 2 


Calcular: 


51. Expresar mediante sumatorias las siguientes sucesiones de 
términos: 


xl + xo xj het 
17 , 


1 2 3 
b. M2 +FX23+FX34 ht 
E Xx 
A 
C. E Mi 


d. (x +y Y +(% +y)+(x + y Y El + y ds 
1 2 2 3 3 4 k k+1 
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52. Sea la tabla de datos: 


l X; Y; 
1 5 1 
2 4 2 
3 3 3 
4 2 4 
5 1 5 
Calcular: (a +2 y + y Y 
53. Sea la tabla de datos: 
¿ X; Y; Zi 
1 2 3 3 
2 1 2 2 
3 1 3 4 
4 2 2 1 
5 1 2 2 
Calcular: 
5 
a) 
Nx, + YY + 20, + 25) 
a) E 
Y +2D)01 +3), —5) 
b) El 
5 
S (4x; Sy; — Dz) +2 y¡ —32;) 
c) e 
Y (a, +27) + 9,0 +22) + 2,(2; +2x,)] 
d) Sl 


54. Sean las sumatorias: 


2%, =274 Y xi? = 3834 
El El 


Hallar: 
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20 


a). YLSG 220% — 1)?] 


20 


b). Y Lx. (7x, +2) -3x,(4x, +1)] 


0) Y u[Ex +46x -5)] 


20 
d). '10Gx, +5) 
i=1 


20 


e). )(2x, +5)(2x, -5) 


Explorando el SPSS 
Al activar el SPSS mostrara una ventana con las opciones de vista de 


variables y vista de datos, que se puede seleccionar en la parte inferior 
izquierda: 
(9 sin tutor 


[ComjunteDetovO] - IBM SP55 StntticsEditor de datos o 
Archivo Ear ser Qulos Transtomsr Anales Gráficos Lbdsdes Amplisciones Ventana Amps 


310 MD c> BEAR MAA ol] 


[Homero Tipo | Anchura Decimales Etiqueta Valores | Perddos Columnas  Almeación Meda. Rol 


Antes de empezar a ingresar los datos, lo que se tiene que hacer es 
definir las variables; la vista de variables presenta las siguientes 
opciones: 
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Nombre: Nombre abreviado de la variable, no acepta caracteres $, +; 
no permite dejar espacios en blanco. 

Tipo: Para indicar el formato de la variable: numérico, cadena. 

Anchura: Para determinar la cantidad de caracteres que tendrá un 
dato. 

Decimales: Para datos de tipo numérico o moneda. 

Etiqueta: Nombre completo de la variable. 

Valores: Para el caso de variables cualitativas se puede definir a que 
categoría corresponde cada valor. 

Perdidos: Indica que valores son codificados como datos perdidos o 
excluidos del análisis. 

Columna: Define como será la alineación de la columna y se 
visualizará en la ventana de ingreso de datos. 

Alineación: Define como será la alineación de los datos en la ventana 
de ingreso de datos. 

Medida: El SPSS distingue tres tipos: escala, nominal y ordinal. 


$2 vimedi6.sav [ConjuntoDatos!] - 18M SPSS Statistics Editor de datos == 0 xXx 
Archivo Editar Ver Datos Transformar Analizar Gráficos Uñilidades Ampliaciones Ventana Ayuda 


Seo M o SLP MES mole 


Nombre Tipo Anchura |Decimales| Etiqueta Valores Perdidos | Columnas | Alineación Medida Rol 

1 Profesor Numérico 8 o Profesor (1, Alberto)... Ninguna 8 Derecha gi Nominal » Entrada 
2 Alumnos Numérico 8 0 Alumnos Ninguna Ninguna 8 3 Derecha — ¿Nominal YN Entrada 

3 Exámenes — Numérico 8 0 Exámenes Ninguna Ninguna 8 == Derecha — gi Nominal » Entrada 

4 Resultados Numérico 8 2 Resultados Ninguna Ninguna 8 3 Derecha $ Escala > Entrada 

5 

6 

7 

7 

10 

13 

16 

17 

19 

20 

21 

24 

26 

21 
28 

29 

30 

33 

34 

ES 

36 Si 

IIJÁEEEÁÁKÁKÁÓÓÓOAA A a 
IBM SPSS Statistics Processor está listo Unicode:ON 
; 1228 p.m. 

|| / Escribe aquí para buscar 4 639"-.2038 m0 
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CAPÍTULO 2 
ORGANIZACIÓN DE DATOS 


INTRODUCCIÓN 


Tiene por objetivo presentar los datos cualitativos o cuantitativos de 
una muestra, para una o más variables de interés, en tablas de 
distribución de frecuencias y sus correspondientes gráficos. Con la 
finalidad de resumir los datos de la muestra, para un mejor análisis e 
interpretación. 


2.1. ORGANIZACIÓN DE DATOS 


Los datos recopilados de una población, lo cual conforma la muestra al 
azar, para el estudio de una variable de interés, conducen muchas 
veces a una gran cantidad de números o atributos, los cuales al intentar 
analizarlos en su forma original presentan dificultad en cuanto a su 
análisis e interpretación. Existe muchas interrogantes sobre la 
naturaleza de los datos, tales como: 


a. Que dato o grupos de datos se presenta con la mayor o menor 
frecuencia. 

b. Cual es la distribución empírica de estos datos con respecto a la 
población (simétrica o asimétrica). 

C: La presencia o no de datos discordante (atípicos). 

d. Ubicar las medidas de tendencia central, que representan al 


conjunto de datos. 


Estas interrogantes se resuelven si los datos son organizados y 
presentados en tablas de distribución de frecuencias (univariadas, 
bivariadas, etc.). 


Una tabla de distribución de frecuencias es un arreglo rectangular en 
filas y columnas en la cual los datos de una muestra o población son 
resumidos. En la primera fila de la tabla se colocan: el nombre de la 
variable en estudio, la frecuencia absoluta, la frecuencia relativa, la 
frecuencia absoluta acumulada, la frecuencia relativa acumulada y la 
marca de clases, esta última solo para variables cuantitativas 
continuas. 
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Titulo: 

Variable Eeeueadia. liFrecuentla Frecuencia Frecuencia Marca 
absoluta selaliva absoluta relativa de 

estudio acumulada | acumulada | clase 

Clase-1 

Clase-2 

Clase-k 

Total 

Leyenda: 

Fuente: 

2.2. ELEMENTOS DE UNA TABLA DE DISTRIBUCIÓN DE 


FRECUENCIAS 
A” TÍTULO 


Se coloca en la parte superior central de la tabla, el título debe 
ser claro y conciso y guarda relación con la variable que se 
estudia y debe indicar el tamaño de la muestra. 


. FUENTE 


Se coloca en la parte inferior de la tabla y corresponde al nombre 
de la entidad (pública o privada) o literatura de donde se obtuvo 
la información, debe incluir la fecha si es posible. Si el mismo 
investigador es autor de dicha información, debe colocar fuente 


propia. 
. LEYENDA 


Se coloca delante de la fuente y corresponde a una nota o 
aclaración con respecto al contenido de la tabla. La leyenda se 
coloca solo cuando es necesario. 


. CLASES 


Los datos (valores que toma la variable) de la muestra se 
clasifican en clases. Las clases son cualidades, números o 
intervalos; si la variable es género, las clases son: varones o 
mujeres, si la variable es número de hijos por familia las clases 
son: familias que no tienen hijo O hijos, 1 hijo, 2 hijos, etc. Si la 
variable es edad de estudiantes universitarios las clases podrían 
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ser 18 hasta 22, 22 hasta 26...,etc. Las clases para una tabla de 
distribución de frecuencias deben ser mutuamente excluyentes; 
es decir, un dato de la muestra solo pude pertenecer a una 
determinada clase. Al número de clases de una tabla se le 


representa por la letra "k". 

Si existe una gran cantidad de datos discretos o continuos, el 
número de clases debe encontrase entre 5 y 15. Un número 
pequeño de clases puede ocultar la distribución real del conjunto 
de datos, mientras que un número muy grande puede dejar sin 
observaciones algunas de las clases, limitando de esta forma su 
uso. 


. FRECUENCIA ABSOLUTA 


Su valor indica el número de veces que los datos de la muestra 
caen o pertenecen a una determinada clase. Se representa por 


Í. Para una muestra de tamaño "an" ycon "k" clases se 
cumple que la sumatoria de todas las frecuencias absolutas es 


igual a "n"; es decir, 
k 
Yon 
i= 
Siendo 


Ep valor que toma la frecuencia absoluta en la ¡-esima clase 


n = tamaño de la muestra 
k = números de clases 


. FRECUENCIA RELATIVA 


Su valor indica la proporción o porcentaje de la muestra está 
contenida en una determinada clase (parte de la muestra que 


pertenece a una determinada clase). Se representa por h;  yse 


obtiene al dividir la frecuencia absoluta por el tamaño de la 
muestra; es decir, 


p=h (En proporción) 
on 
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h - 100% (En porcentaje) 


i 


n 


En ambos casos se cumple que: 


k 


Nota: $ hi=1 o 100% 
il 
. FRECUENCIA ABSOLUTA ACUMULADA 


Para una variable discreta, un valor de frecuencia absoluta 
acumulada indica, cuantos datos de la muestra son menores o 
iguales al valor de la clase correspondiente; para una variable 
continua, indica cuantos datos de la muestra, tienen valores 
menores al límite superior para esa clase. Se obtiene al 
acumular los valores de las frecuencias absolutas. Se representa 


por F; , y se obtiene por: 


Fs El... k 
2 
k 


Nota: Fk =)> f .=n 
Fi= f+F., F-1=0 


. FRECUENCIA RELATIVA ACUMULADA 


Para el caso discreto, un valor de frecuencia relativa acumulada, 
indica la proporción o porcentaje de datos de la muestra que 
tienen valores menores o iguales al valor de esa clase; para el 
caso continuo, indica la proporción a porcentaje de datos de la 
muestra que tienen valores menores al límite superior para esa 
clase. Se obtiene al acumular los valores de las frecuencias 


relativas para cada clase. Se representa por H;. 


H;= yn ¡=1,2....,k 
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También se obtiene dividiendo cada valor de la frecuencia 
absoluta acumulada por el tamaño de la muestra; es decir; 


F, 
E "_ di=l2..k 
n 
Nota: H,=1 o 100% 
HA |=h,+H.,; H-¡=0 


. MARCA DE CLASE 


El concepto de marca de clase, solo se usa cuando se elabora 
una tabla de distribución de frecuencias para una variable 
cuantitativa continua, y su interpretación matemática de su valor, 
corresponde al punto medio para una determinada clase. 
Estadísticamente, es un valor representativo para todos los 
datos que pertenecen a una determinada clase, se representa 


por X; Se calcula usando la fórmula: 


X= Limite inf erior de la i — esima clase + Limite sup erior de la i — esima clase 
i 2 
LI +ES 
¡E 
Nota: 


En una tabla de distribución de frecuencias con ancho de clase 
fijo, se cumple que: La segunda, tercera, ...k-ésima marca de 
clase, es igual a la marca de clase anterior más el ancho de 


clase, es decir: 


X= +A  1i=2Zik=l 


Donde Á = ancho del intervalo de clase (ancho de clase) 
Demostración 
X= O (0) 
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ET ,,+ES,, 
X ¡1 = : 2 (2) 
como Ll,, =LES; LES,, =LSi+ A 
LSi+ LS¡+ A 
i+l => 2 (3) 
6)=-( 
XxX -X' _ESi+ ESi+ A LI ¡+ ES; 
i+l i 2 2 
a LSi-— LIT ¡+A 
Xi X= como LS; — LI ¡=A 
qdo 
X -—X'= =ADOX"' =X'"+A 
¡rl LOTA ¡+1 i 
2 
Nota 
Í =F,-F,; 
h.=H.- H 


2.3. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA UNA 
VARIABLE CUALITATIVA 
Cuando los datos corresponden a una variable cualitativa 
(Nominal o Jerárquica) la tabla de distribución de frecuencias 
tiene la siguiente forma: 


Título: Corresponde a la variable en estudio 


i Variable fi hi 
1 Ci fi hi 
2 C> fa ha 
k Cr Fr hx 
Total n 1 


Fuente: Entidad que proporciona los datos 
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Los valores C; corresponden a valores que toma la variable (clase), 
si la variable es nominal no existe un orden entre sus valores, en 
cambio si la variable en estudio es ordinal o jerárquica debe tomarse en 
cuenta el orden de sus valores, ya sea en forma ascendente o 
descendente. 

Para esta variable se presentan algunos tipos de gráficos, pero los más 
frecuentes es el GRÁFICO de barras verticales u horizontales, 
GRÁFICO circular, GRÁFICO de líneas y gráficos pictóricos. 


Ejemplo 

Con la finalidad de estudiar la variable X = Preferencia a determinados 
marcas de jabones de tocador por las alumnas de la UNMSM, se toma 
una muestra aleatoria conformada por 30, los resultados son: 


Rexona  Palmolive  Rexona  Camay  Palmolive Lux 


Camay Lux Lux Rexona Camay Lux 
Camay Rrexona Camay Lux Lux Camay 
Lux Camay Rexona  Rexona Camay Lux 
Lux Camay Palmolive Lux Lux Lux 


Fuente : PACOCHA S.A. 
Para este ejemplo la tabla de distribución de frecuencias es: 


Preferencias a marcas de jabones de tocador por alumnas de la 


UNMSM (n=30). 
¡ Marca de jabones fi hi; h;*100% 
de tocador 
1 Rexona 6 0.2 20% 
2 Camay 9 0.3 30% 
3 Lux 12 0.4 40% 
4 Palmolive 3 0.1 10% 
Total 30 1.0 100% 


Fuente: PACOCHA S.A 


Calcular e interpretar: 


f-= 9 alumnas encuestadas prefieren el jabón de tocador de marca 
camay 


h2= 30% de las alumnas encuestadas prefieren el jabón de tocador de 
marca) Camay. 
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GRÁFICA DE BARRA 
Preferencias a marcas de jabones de tocador 
Por alumnas de la UNMSM 


Oop_ nvyR* o 


Rexona Camay Lux Palmolive 


Fuente: PACOCHA S.A 


GRÁFICA CIRCULAR 


3 
6 
10% Sl 
(Palmolive) di 
(Rexona) 


40% 9 
(Lux) 
30% 
(Camay) 


E Rexona El Camay m Lux E Palmolive 
Fuente: Pacocha S.A 


Aplicando el SPSS en el Cálculo de las frecuencias, y gráficos. 
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a. Definiendo las variables 


UA +5 titulo? [ComjuntoDatos2] - IBM SPSS Statistics Editor de datos - o x 
Datos — Iramsformar Analizar Gráficos  ¡ibiidades Ampliaciones Ventana Ayuda 
F Car 
imales! — Etiqueta Valores | Perdidos Columnas] Almeación Meda Ral 
de jabon — Minguna — Minguna 10 EE izquierda — dh Nominal Entrada 


lala SPSS Statistics Processor está listo Unicode: ON 


b. Ingresando los datos 


ÁB FRECUENCIAS saw [ConjuntoDato=2] - IBM SPSS Statistics Editor de datos - 0 x 
Archivo Editar Yer Datos  Iramstormar Analizar Gráficos Lbiidades Ampliaciones Ventana Ayuda 


318 -a 24H n= 49 


Visible: 1 de 1 vanadles 


¡da Marca jabon. ve 0 var ver var var var var var var var var var 
1 Rexona 
2 Camay 
3 Camay 
4 tax 
5 lux 
5 |Palmoine 
TJ 
B_Rexona 
9 Camay 
10 Camay 
11 Rexona 
[2 Ju 
13  Camay 
14 | Rexona 
15 | Palmoine 
16 Camay 
17 Rexona 
18 Jtux 
19 Rexona 
20 tax 
Palmole 
Camay 
Lux 


¡BH SPSS Statistics Processor está listo Unicode. ON 
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e 


Calculando las frecuencias: En el menú del SPSS, escoger la 
opción ANALIZAR-ESTADISTICOS DESCRIPTIVOS- 
FRECUENCIAS-pasar la variable Marca_jabon al casillero de la 

derecha-y ACEPTAR 


1 sin titulo? 
Archivo Editar Ver 


¡ConjuntoDatos?) - I8M SPSS Statistics Editor de datos 


Datos Transformar Analizar Gráficos Utilidades Ampliaciones Ventana Ayuda 


ELENA EEN ESTO 


22: Marca_jabon 


Cama; 


Visible: 1 de 1 variables 


12 Lux 


| L Escribe aquí para buscar 


Y Mostrartablas de frecuencias 


EM SPSS Statistics Processor está listo 


[da Marca jabon va: va ar var var var var var : var var var 
1 Rexona e 
2 | Camay 
3 Camay Variables Casaaisios) 
4 Lux a Marca de jabon [Ma 
205 Sc) 
SL] panás Fomao. ) 
8 s [e 
E tos ss ens 
E Cormay 
10 | Camay 


Unicode:ON 


d. Resultados: 
Marca de jabón 

Porcentaje Porcentaje 

Frecuencia Porcentaje válido acumulado 
Válido Camay 9 30,0 30,0 30,0 
Lux 12 40,0 40,0 70,0 
Palmolive 3 10,0 10,0 80,0 
Rexona 6 20,0 20,0 100,0 

Total 30 100,0 100,0 
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e. Gráficos barra: En el menú escoger la opción GRÁFICOS- 
CUADROS DE DIALOGO ANTIGUOS-BARORAS-SIMPLES- 
DEFINIR-pasar la Variable Marca de jabón a la casilla eje de 
categoría-ACEPTAR 


Recuento 


Camay Lux Palmolive Rexona 


Marca de jabon 


f. Gráficos Circular: Gráficos barra: En el menú escoger la opción 
GRÁFICOS-CUADROS DE DIALOGO ANTIGUOS-CIRCULAR- 
RESUMENES PARA GRUPO DE CASOS-DEFINIR-pasar la 
Variable Marca de jabón a la Definir porciones por-ACEPTAR 

Marca 
jabon 

Bcamay 

MEsincivo 

MRexona 
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2.4. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA UNA 
VARIABLE CUANTITATIVA DISCRETA. 


Cuando los datos corresponden a una variable cuantitativa discreta la 
tabla de distribución de frecuencias tiene la siguiente forma: 


Título: corresponde a la variable en estudio 


¡ Variable fi hi Fi; H; 

1 Ci fi hi Fi Hi 

2 C> fo ha F2 HA 2 

k Cr Fr hr Fi H y 
Total n 1 


Fuente: entidad que proporciona los datos 
Los valores C; corresponden a valores que toma la variable (clase) 


Ejemplo 

Los siguientes datos corresponden a una muestra aleatoria de 50 
tiendas que se dedican a la venta de gas, con la finalidad de analizar la 
variable Y = número de balones de gas vendidos en un día 
determinados, los resultados son: 

21 23 24 23 24 21 24 23 24 22 22 24 

21 22 24 22 24 25 26 25 24 23 23 21 

23 23 22 24 26 26 22 23 22 24 21 25 


22 23 25 26 24 22 25 24 25 21 26 23 
25 24 


Elaborar la Tabla de distribución de frecuencias y sus gráficos 
respectivos 
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Número de balones de gas vendidos (n=50 tiendas) 


: Variable 
, Í h; E i A i 
1 21 6 12 6 12 
2 22 9 18 15 30 
3 23 10 20 25 50 
4 24 13 26 38 76 
5 25 7 14 45 90 
6 26 5 10 50 100 
TOTAL 50 100 


Fuente: SOL GAS S.A 

Hallar e interprete: 
f3= 10(significa que 10 tiendas, tienen una venta de 23 balones de 
gas) 
h2 =20%( significa que el 20% de las tiendas, tienen una venta de 23 
balones de gas) 
Fa =38 (significa que 38 tiendas, — tienen una venta entre 21 y 24 
balones de gas o menor o igual a 24 balones de gas) 
F5— F2=45-15=30(significa que 30 tiendas, tienen una venta entre 23 


y 25 balones de gas) 
Gráfica de bastones 


NUMERO DE BALONES DE GAS VENDIDO EN 
UN DIA DETERMINADO 


___—_— _— A _Í_O Qu 073 XA 
10 
10 7 9 
7 
6 
5 
5 
0 y 
0500057 tl Vesta Cut Pes CT PE 
21 22 23 24 25 26 
FUENTE:SOL GAS 


S.A. 
Aplicando el SPSS en el cálculo de las frecuencias, y gráficos. 
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Definiendo las variables 


42 *Sin titulo [ConguntoDetos3] - 18M SPSS Statestxcs Editor de datos == o x 
Arco Ecitar Ver Datos Jranstomer analizar Gráncos Uicades Ampliaciones Ventana Ayuda 


ECETIA El BA no 
Tipo Anchura | Decimales Etiqueta Valores | Perádos |Colummas | Alineación Medida Ral 


8 o Dia venta ges — Ninguna Ninguna 13 Mé iequierta — Si Nominal Entrada 


¡EM SPSS Stalstcs Processor está listo 'Unicode:ON 


Ingresando los datos 


MA +5 titulo [ConguntoDatos3] - IBM SPSS Statistics Editor de datos = o x 
Archivo Editar ver Datos Transformar Analizar Gráficos |Mdades Ampliaciones Ventana Ayuda 


ShH8R ca ME ARA AA ¿ole 


Visible: 1 08 1 variables 


da Dia vomta_gas ] var ar = ar = Sr e sar se sar e = sa pr 

EJ 2 

2 

37] 

m 

E] 

» E 

E] 

35 


ICE 
ERAS NNERRRRNASRR2.EASARA 


BM SPSS Statistics Processor está histo Unicode:ON 
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Calculando las frecuencias: En el menú del SPSS, escoger la opción 
ANALIZAR-ESTADISTICOS DESCRIPTIVOS-FRECUENCIAS-pasar la 
variable días de venta gas al casillero de la derecha-y ACEPTAR : 


ECTS E LAN ERA 


| da Dra_venta_gas <a . .0. 
> 


2328 rreor228a 


Resultados: 
Dia venta gas 
Frecuenci  Porcentaj Porcentaje Porcentaje 
a e válido acumulado 
Válido 21 6 12,0 12,0 12,0 
22 9 18,0 18,0 30,0 
28 10 20,0 20,0 50,0 
24 13 26,0 26,0 76,0 
23 7 14,0 14,0 90,0 
26 5 10,0 10,0 100,0 
Total 50 100,0 100,0 
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Gráficos barra: En el menú escoger la opción GRÁFICOS-CUADROS 
DE DIALOGO ANTIGUOS-BARAS-SIMPLES-DEFINIR-pasar la 
Variable Dia venta gas a la casilla eje de categoría- ACEPTAR 


Recuento 


21 22 23 24 25 26 


Dia venta gas 


2.5. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA UNA 
VARIABLE CUANTITATIVA CONTINUA 


Cuando los datos corresponden a una variable cuantitativa continua la 
tabla de distribución de frecuencias tiene la siguiente forma: 


Título: corresponde a la variable en estudio 
variable XxX 

f. h¡F!|HO i 
1 Ci Ah | Fi H|X, 
2 C, flhn|Fo|H2|X, 


=. 


K Cx Fi | h, n 1 dl 
Total n 1 


Fuente: entidad que proporciona los datos 
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Los valores C; corresponden a valores que toma la variable (clases) 


Elaborar la Tabla de distribución de frecuencia y sus gráficos 
respectivos 


PROCEDIMIENTO PARA ELABORAR UNA TABLA DE 
DISTRIBUCION FRECUENCIAS PARA UNA VARIABLE 
CUANTITATIVA CONTINUA 


Cuando los datos pertenecen a una variable cuantitativa continua, las 


clases C; corresponden a intervalos de la forma [a , b) , llamados 


intervalos de clases, siendo “a” y “b” el límite inferior y superior 
respectivamente del intervalo de clase. 


METODOLOGÍA 
1. Determinación de Rango R 


R =dato mayor - dato menor 


2. Determinación de número de clases K 


K=1+3.3log(n) n=tamaño de la muestra 


Como el valor de k debe ser un numero entero, usar el 
redondeo simple 


3. Determinación de ancho del intervalo de clase ( 4) 
R [Usar redondeosimple, con el mismo 


K Unúmerode decimalesde los datos 
El redondeosimple casi siemprese comete error(E) 


[10 > El dato de Arranque para la tabla = dato menor 
E=(AK-—R3ii) > 0 > El dato de arranque para la tabla = dato menor — 

| Z 

| [iii) < 0 > El númerode clases se incrementaen 1 y se sigue(i ó ii) 


El dato de arranque para la tabla es el primer limite inferior del intervalo 
de clase. 
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Ejemplo 

Una muestra aleatoria de tamaño n = 34, es tomada con la finalidad de 
estudiar la variable W = peso del recién nacido en la Maternidad de 
Lima. Los resultados en Kg. se presentan a continuación: 


15161920 21 21 23 24 25 25 26 2.6 2.7 28 2.9 3.0 3.1 
3.1 3.2 3.2 3.2 3.2 33 33 33 3.4 3.4 3.5 3.6 3.6 3.7 3.7 3.9 4.1 


Fuente: Maternidad de Lima. 
Metodología 
1. Cálculo del Rango” R*. 


R = peso mayor —peso menor. 
R =4.1-1.5=2.6 


2. Cálculo del número de clases (K). 
K=1+3.3Log(34) = 6.05388 


Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 


OBSERVACIÓN 

El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o igual a 5, entonces la cifra 
entera del número se incrementa en una unidad. 


Ejemplo: 


Si, K= 6.7, usando el redondeo simple K = 7; 
Si, K= 6.4, usando el redondeo simple K = 6; 


a. Cálculo del ancho del intervalo de clase (A) 


El ancho del intervalo de clase se obtiene a través de la siguiente 
fórmula: 


R 
K 
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Para los datos se tiene: 
8 = an 0.43333 


K 6 


El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 


A =0.4 
E=AK-R =0.4(6) - 2.6 = 0.2 


Como el error es negativo, se debe incrementar en una clase 
más(k=7) 
- 20 


7 


A 


A = 0.4 


E=AK-—R=0.4(7) - 2.6 =0.2 


Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 


E 0.2 
valor de arranque= dato menor=_=1.5- _ =14 


2 2 
Para determinar los intervalos de clases es como sigue: 


. El valor de 1.4 es el límite inferior de la primera clase, el 
límite superior de esa clase se obtiene sumándole a 1.4 el 
ancho de clase 0.4, lo cual da como resultado 1.8. 


. El límite inferior del segundo intervalo de clase, 
corresponde al límite superior del primer intervalo de clase 
(1.8) y para obtener su límite superior, al límite inferior de 
ésta clase se le añade del ancho de clase; y así 
sucesivamente hasta completar las 7 clases. 


. Se utiliza un ancho de clase fijo, permite realizar 
comparaciones de una clase con otra (cuantos elementos 
de la muestra pertenecen a una determinada clase). 

Luego la tabla de distribución de frecuencias para los pesos de 
los recién nacidos es: 
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Pesos (kg.) de recién nacidos registrados en la maternidad de Lima 


(n=34) 

| Pesos | f | hi (F, | H | X, 
1 [1.4 -1.8) 2 5.88% 2 5.88% 1.60 
2 [1.8 _ 2.2) 4 11.76% 6 17.64% 2.0 
3 [2.2 2.6) 4 11.76% 10 29.40% 2.4 
4 [2.6 -3.0) 5 14.71% 15 44.11% 2.8 
5 [3.0 Eo 4) 10 29.42% 25 73.53% 3.2 
6 [3.4 3.8) 7 20.59% 32 94.12% 3.6 
7 [3.8 0 4.2) 2 5.88% 34 100% 4.0 

TOTAL 34 100.0% 


_ 


Hallar e interpretar los siguientes valores: 
f,_h,F,H,H-H,X'. 
3 3 3 3 5 2 2 
da = 4 (Significa que hay 4 recién nacidos que tienen un peso mayor o 
igual a 2.2 Kg, pero menor a 2,6 Kg.) 
h3 = 11.76%/( Significa que el 11.76% de los recién nacidos tienen un 
peso mayor o igual a 2.2 Kg, pero menor a 2,6 Kg.) 
F3=10 (Significa que hay 10 recién nacidos que tienen un peso mayor 
o igual a 1.4 Kg, pero menor a 2.6 Kg.) 
H 3 = 29.40% (Significa que el 29.40% de los recién nacidos tienen un 
peso mayor o igual a 1.4 Kg, pero menor a 2.6 Kg.) 
H,-H ,= 55.89% (significa que el 55.89% de los recién nacidos tienen 
un peso mayor o igual a 2.2 Kg, pero menor a 3.4 Kg.) 
X ,= 2.0 kg (significa que 2.0 Kg., es el peso representativo para los 


recién nacidos que tienen un peso mayor o igual a 1.8 Kg., pero menor 
a 2.2 Kg.) o es un peso representativo para la 2da clase. 
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2. ¿Cuántos recién nacidos aproximadamente tienen un peso 
menor a 2.8 Kg. 
Por interpolación lineal 
2.8 Kg, se encuentra en la cuarta clase; 10 recién nacidos tienen un 
peso menor a 2.6 kg; 15 recién nacidos tienen un peso menor a 3 kg y 
*x” recién nacidos tienen un peso menor a 2.8 kg. (utilizando la 2da y 
5ta columna) 
limsup. Fi 
26 10 30-26 15-10 
2.8 x 30-28  15-x 


3.0 15 


>x=12.5= 13 


Aproximadamente 13 recién nacidos tienen un peso menor a 2.8 kg. 


3. ¿Qué porcentaje de los recién nacidos tienen un peso inferior a 
2.8 kg. 


Como 12.5 recién nacidos tienen un peso inferior a 2.8 Kg, 
entonces 


jas HO 67% 


34 


4. ¿Qué porcentaje de los recién nacidos tienen un peso superior a 
2.8 kg. 


Como 12.5 recién nacidos tienen un peso menor a 2.8 kg, 
entonces y =34-12.5=21.5 recién nacidos tienen 
pesos superiores a 2.8 kg, luego: 


>y=25 > 213 100% = 63.24% 
34 


5. ¿Qué porcentaje de los recién nacidos tienen pesos entre 2.0 kg 
y 3.6 kg. 
2.0 kg 3.6 kg 


Buscamos cuantos tienen un peso menor a 3.6 kg y cuantos tienen un 
peso menor a 2.0 kg, la diferencia de ambas cantidades, nos da 
cuantos recién nacidos tienen pesos entre 2.0kg y 3.6 kg. 
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Un peso menor a 3.6 kg 


limsup. Fi 
3.4 25,38-34_32-25_ 285 
3.6 a 3.8-36  32-a 
3.8 32 
Un peso menor a 2.0 kg 
limsup. Fi 
1.8 2 322-18_6-2 3-4 
2.0 10) 2220 6-b 
2.2 6 
24.5 
x=a-b=28.5-4=245> (100%) = 72.06% 
34 


El 72.06% de los recién nacidos aproximadamente tienen pesos entre 
2.0 kg y 3.6 kg. 


6. ¿Qué peso acumula al 75% de los recién nacidos 

limsup. H; 

3.4 73.53% 32834 FAL TISIT a 3 M3 
x 75.00% 3.8-x 94.12% —75% 

3.8 94.12% 

GRÁFICAS: 


Histograma de frecuencias 


Para construir el histograma de frecuencias, se coloca en el eje de la 
abscisa los intervalos de clase, y en el eje de la ordenada las 
frecuencias que pueden ser absolutas o relativas. Al conjunto de 
rectángulos formados, se le llama histograma de frecuencias que 
puede ser absoluta o relativa 

Para construir el polígono de frecuencias se une los puntos medios de 
la parte superior de los rectángulos (marcas de clases) y para que este 
polígono este cerrado se crea marcas de clases ficticias, restándole a 
la primera marca de clases el valor del ancho de clase y sumándole a 
la última marca de clases el valor del ancho. Obteniéndose de esta 
manera un conjunto de líneas quebradas, llamada polígono de 
frecuencias, que puede ser absoluta o relativa. 
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Histograma de frecuencias 


Polígono de frecuencias 


Gráfica de la Ojiva (Menor que) 


Para construir la Ojiva en el eje de la abscisa se colocan los intervalos 
de clases y en eje de la ordenada las frecuencias acumuladas 
absolutas o frecuencias acumuladas relativas. Por ejemplo la gráfica 
de la Ojiva para los pesos de los recién nacidos se obtiene de la 
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siguiente manera, cero recién nacidos tiene un peso menor a 1.4 kg; 2 
recién nacidos tienen un peso menor a 1.8 kg; 6 recién nacidos tienen 
un peso menor a 2.2 kg; 10 recién nacidos tienen un peso menor a 2.6 
kg; 15 recién nacidos tienen un peso menor a 3.0 kg; 25 recién 
nacidos tienen un peso menor a 3.4 kg; 32 recién nacidos tienen un 
peso menor a 3.8 kg y 34 recién nacidos tienen un peso menor a 4.2 
kg, uniendo estos puntos se obtiene la curva creciente a la derecha 


llamada la Ojiva( “Menor que” ). 
Fi 


40 7 


35 


30 
25 


20 - 


—= Fi 


1.8 2.2 2.6 3 3.4 3.8 4.2 


Aplicando el SPSS en el cálculo y gráficos. 


Definiendo las variables 


Bl SPSS Statistics Processor está sto Unicode ON 
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Ingresando los datos 


42 sin tulo! [ConjuntoDato=0] - IBM SPSS Statistics Editor de datos 
Archivo Ear Yer Qatos Transformar Analizar Gráficos bidades Ampliaciones Ventana Ayuda 


3h8 Ma EAU A AA ola 


Visible 108 1 vanables 


Peso_tecr 
$4 en_nació 


3 
3 
2 32 
3 
3 


| | L Escribe aquí pa 


Se elabora la tabla de frecuencias para datos agrupados: 


1. Cálculo del Rango” R “. 


R = peso mayor —peso menor. 
R =4.1-15=2.6 


2. Cálculo del número de clases (K). 
K=1+3.3Log(34) = 6.05388 


Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 


OBSERVACIÓN 

El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o igual a 5, entonces la cifra 
entera del número se incrementa en una unidad. 


Ejemplo: 


Si, K= 6.7, usando el redondeo simple K = 7; 
Si, K= 6.4, usando el redondeo simple K = 6; 
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3. Cálculo del ancho del intervalo de clase (A) 
El ancho del intervalo de clase se obtiene a través de la siguiente 
fórmula: 


R 
A= 
K 
Para los datos se tiene: 

R_ 26 


K 6 
El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 


A=0.4 
E=AK-R=0.4(6) - 2.6 =-0.2 


Como el error es negativo, se debe incrementar en una clase 
más(k=7) 


A= = 0.43333 


E=AK-—R=0.4(7) - 2.6 = 0.2 


Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 


E 0.2 
valor de arranque= dato menor=_=15-= _ =14 


2 2 


En el menú del SPSS, escoger la opción TRANSFORMAR- 
RECODIFICAR EN DISTINTAS VARIABLES-pasar la variable peso- 
recién-nacido al casillero de la derecha, en la derecha en donde indica 
variable de salida Nombre: poner peso_recien_nacido1 y en la etiqueta: 
poner Peso recien nacidol — PRESIONAL LA OPCION CAMBIAR- 
VALORES ANTIGUOS Y NUEVOS-RANGO-poner desde 1,4 hasta 1,8, 
luego en VALOR poner 1 y AÑADIR, así sucesivamente continua con 
todos los rangos de 3,8 hasta 4,2. 


70 


EsTADÍSTICa DESCRiptiva y prOBABILIDAd pARa LAS CIENCIAS DE LA INFORMAción CON El USO DEl spss 


e 
Archie Estar Yer Datos Iranstomar ánalizar Gráficos |ilidaces Ampliaciones Ventana 


208 ro EMI ole 


Tipo Ancha [Decirle Esque Valores Perdidos | Columnas| Alineación | Medida | Ral | 
1 er Numérico. 8 Peso recien na... Ninguna Ninguna 8 HN Derecha — $ Escala Y Entrada 
> a 
=— | 
., | Variable de salida 
LE 3 Hombre: | 
AE a | ] 
E | | Evaueta — 
| | [Peso recien nacio 
3 
A | ES 
>| 
S | 


7] EA 


CD to a 
1 
5 | Recacíficar en verisbles diferentes: valores entiguo y nuevo Xx 
_2 vator antiguo Vatcr nuevo 
—2% | Oyntor vajoe [ ] 
2 O Pecaido gel sistema 
E | O Perdido del gistema O Copiar valores antguos 
a | O Perdido por el sistema o el usuario 
25 ponia Antiguo —> Muero 
27 Ñ 140181 
58 ] 
E nasta tros 
——— E Al ] 
2 | O Rango, LOWEST hasta el vator 
E 
| 
z O Rango, valor hasta MIOHEST. 


2 12 Las varianles de salida son senes 
= = O Too0s los demás valores m 


[ima SPSS Stabates Processor está isto ¡Unicode ON 


¡Columnas Alineación | Medida | Rol 
-0n_nacido Numénco Paso recien na MU Derecha 8 Escala Y Entrada 


$ Recodificar en vonobles diferentes valores antiguo y nuevo. x 


Valor antiguo Valor nuevo. 


O valor. 8 valor [7 


O Percico del sistema a 
| O Perdido del sistema. O Coggar valores antiguos 


O Percido por el sistema o el suano 


Bs o) 


28m 394 
30m 345 
24M 385 


hz _ 5 
| O) Rango, LOWEST hasta el valor 


O Rango. valor hasta MIGHEST 
Las vanabies de sañda son seres 
| O Tados loz demás valores 


-—y a 
=== LGononuar) | Cancetar | aves 


IBM SPSS Staistics Processor está listo Unicode:ON 


| | / Escribe aquí para buscar ) i on» e 3 a Y 

Cuando se termine del ingresar los noo: presionar, continuar y 
aceptar. 

Y se crea una variable Peso _recien_nacido_1. 


m 
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M3 sin tuto! [CorguntoDatos0) - IBM SPSS Sratistics Editor de datos = o x 
Acho Editar Yer Datos Iransformar Analizar GráScos imoades Ampliaciones Ventana Ayuda 


2H8W a 2 Li 3 «1 [el 


Anchura Decimales. Etiqueta. Valores Perdidos  Colurmas  Almeación Medida L Rol 
MNuménco B 1 Peso recien na Ninguna Ninguna U E Derecha $ Escala » Entrada 
Numérico 8 2 Peso recien na Ninguna Minguna 21 Derecha — dh Nominal Entrada 


BM SPSS Statistics Processor está listo Unicode:ON T 


a / Escribe aquí para buscar 
En la variable Peso_recien_nacido A, presionar la opción valores e 
ingresar: 

e 


Arco Ear Nec Datos Transtomar maiz Gráficos iilidades Ampsaciónes Ventana Ayoa 


| Perdidos | Colummas Alineación Medida Ral 
Ninguna e Derecha — SP Escala Y Entrada 
Mnguna O Mimguna 21 Derecha — de Momia Entrada 


x 


= Uaceptr | Goncelar) anio ) 


lg sPs Stats Processor está listo ¡Unicode OM 


Y Poner aceptar. 
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En el Menú del SPSS escoger la opción ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS-FRECUENCIA-pasar la variable Peso recien nacido 1 
al casillero derecho-ACEPTAR, y nos muestra los resultado 


Vi) “Rezutado! [Documernto!] - IBM SPSS Statatica Visor - 0 
Antoo Editar Wer Datos Iransomiar inserar Fomalo Analizar Crifcos LMdades Amplaciones Ventana Amón 


ECT IAE EME TO 


Frecuencias 
[Conguntobazos0] 


Estadisticos 
¡clan nacido! 


. o 


Pero recien nacido? 


+ Frecuencias 


Estadisticos 


"EM SPES Statistics Processor está nto [Unicode OH 253, 7 485 54 


| EEES 0300 2o0v= o cm | 
Histograma de frecuencias: En el menú del SPSS escoger la opción 
GRÁFICOS-CUADRO DE DIALOGOS ANTIGUOS-HISTOGRAMA- 
Pasar la variable Peso recien nacido1 a la casilla variable y ACEPTAR 


12 | Media = 4,21 
Desviación estándar = 1,629 
=34 


Frecuencia 


Peso recien nacido1 


Polígono de frecuencias: En el menú del SPSS, escoger la opción: 
GRÁFICOS-CUADRO DE DIALOGOS ANTIGUOS-LINEAS SIMPLES- 


73 


EsTADÍSTICa DESCRiptiva y pPROBABILIDAd pARa LAs CIENCIAS DELA INFORMAciÓn CON El USO DE] spss 


DEFINIR-pasar la variable Peso recien nacido? a la casilla eje de 
categoría y marcar N CASOS-ACEPTAR 


A “resultado: 
Arceo, Ear Yer Datos Iranstormar insertar a Analizar Gráfcos Ulidades Ampliaciones Ventana  Ayyoa 


Sat IE E 


ECTREETERFES JO 


| Gráfico 


Peso recien nacido1 


Electo CA sanar Registro ¡SU SPSS Stanstica Processor está listo Unicode: ON 44, W 101108 


Polígono de la Ojiva: En el menú del SPSS, escoger la opción: 
GRÁFICOS-CUADRO DE DIALOGOS ANTIGUOS-LINEAS SIMPLES- 
DEFINIR-pasar la variable Peso recien nacido1 a la casilla eje de 
categoría y marcar N ACUMULADO-ACEPTAR 


30 


Frecuencia acumulada 


Camay Lux Palmolive Rexona 


Marca de jabon 
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Gráfica de la Ojiva (“Menor que” y “Mayor que”) 


Supongamos que la variable en estudios es el tiempo (minutos) que 
utiliza un usuario en realizar una transacción bancaria 


Tiempo se 

(riñalos) fi h; F; F, Hi 
2-4 3 0,10 3 30 0,10 
4-6 6 0,20 9 27 0,30 
6-8 12 0,40 21 21 0,70 
8- 10 7 0,23 28 9 0,93 
10-12 2 0,07 30 2 1,00 
Total 30 1,00 

F ES 


¡ = Valor que se obtiene, al acumular los valores de las frecuencias 


absolutas empezando por la última clase, así sucesivamente hasta 
llegar a la primera. 
De la tabla, calcular e interpretar: 


F>=9 , usuarios realizan una transacción bancaria en un tiempo 
menor a 6 minutos. 


F4—F>=28-—9=109 , usuarios realizan una transacción bancaria, en 
un tiempo mayor o igual a 6 minutos, pero menor a 10 minutos. 


De la tabla anterior, se muestra la ojiva menor que (curva ascendente) 


+ 
E, =27 usuarios, realizan una transacción bancaria en un tiempo 
mayor o igual a 4 minutos. 

+ 


F =9 usuarios, realizan una transacción bancaria en un tiempo 
may::or o igu.al a 8 minutos. 


F —F =27-9=18 usuarios, realizan una transacción en un tiempo 
2 4 
mayor o igual a 4 minutos, pero menor a 8 minutos. 


Gráfica de Ojiva menor que 
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De la tabla anterior, calcular e interpretar: 


Gráfica de Ojiva mayor que 


Sea la tabla de distribución de frecuencias tiempo que utilizan 50 
usuarios en realizar una transacción bancaria. 
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Tiempo . ; + 

(minutos) fi Fi F, 
2-4 5 5 50 
4-6 10 15 45 
6-8 20 35 35 
8-10 10 45 15 
10 -12 5 50 5 
Total 50 


Cuantos utilizan un tiempo superior a los 5 minutos 


as la frecuencia absoluta menor que 


a sló64 


5 E 7 35 A . >3x=10 usuarios> para mayor 50-10=40  Rpta. 
6 15!) 

Utilizando la frecuencia absoluta mayor que 

T > ps) 


4 45 |6-4_35-45_2_-10 >x=40 usuarios Rpta. 


5 x [6-5 35-x 1 35-x 
6 35) 


Ejemplo: 
De una muestra de tamaño 50, el dato mayor es 35 y el dato menor 5, 
determinar las clases para la tabla de distribución de frecuencias. 


R=35-5=30 
K=1+3.3log(50) = 6.6 = 7 
desd 

7 
E="x4 - 30= 2 
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usa 
4-8 
to 
30 

A="g =3.75= 416 -20 
120 —24 
24 -28 
28- 32 
| (82-36 

E=8x4- 30 =2 

Veda “=4 

a 2 
NOTA 


La siguiente tabla permite determinar el número de clase, para 
construir la tabla de distribución de frecuencias, utilizando la formula de 
sturges. 
Tabla que proporciona el número de clases 
Para un tamaño de muestra dado 


Tamaño “n” de la Número de clases 
muestra K=1+3.3Log(n) 
20a23 5 
24 a 46 6 
47 a 93 7 
94 a 187 8 

188 a 376 9 
377 a 756 10 
757 a 1519 11 
1520 a 3053 12 
3054 a 6135 13 
6136 a 12328 14 
12329 a 24770 15 


Fuente: Elaborado por el Autor 
Ejemplo aplicativo 
La mayor y menor estatura de 50 personas son respectivamente 1.72 
mts y 1.55 mts. Calcular el número de clases y su ancho para elaborar 
la tabla de distribución de frecuencias. 


78 


EsTADÍSTICa DESCRiptiva y prOBABILIDAd pARa LAs CIENCIAS DE LA INFORMAción CON El USO DE] spss 


Determinación de Rango KR =1.72-1.55=0.17 
2. Determinación de número de clases 
K= 1+ 3.3log(50) = 6.6 = 7 , usando el redondeo simple 


_ 


3. Determinación de ancho de clase Á 


A= =- 0.0242 = 0.02(redondeosimple) 


Al  redondearse se comete error 
E=0.02 * 7 - 0.17 =-—0.03 
Agregamos una nueva clase k=8 
A= == 0.0212 = 0.02(redondeosimple) 
E=0.02 * 8 - 0.17 = -0.01 
Agregamos una nueva clase k=9 
17 
A= 2 0.0188 = 0.02(redondeosimple) 


E = 0.02 * 9— 0.17 = 0.01 


.01 
dato de arranque= 1.55 — eo = 1.545 = 1.55(redondeosimple) 


2 
Los intervalos de clases para esta tabla son: 


Estaturas(mts) f 
1 


1,55-1.57 
1,57-1.59 
1,59-1.61 
1,61-1.63 
1,63-1.65 
1,65-1.67 
1,67-1.69 
1,69-1.71 
1,71-1.73 

Total 50 
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NOTA-3 

No existe una fórmula única para determinar el número de clases (K) 
en la construcción de una tabla de distribución de frecuencias. Un 
número muy pequeño de clases tiende a ocultar la distribución real del 
conjunto de datos, mientras que un número muy grande puede dejar 
sin observaciones algunas de las clases, limitando de esta forma su 
uso. La idea es tener un número de clases de tal forma que todos los 
datos se encuentren en las clases formadas, y además nos permita 
conocer la distribución empírica de los datos. Se sugiere que el número 
de ellos debe variar entre 5 y 15. 


NOTA-4 
Para determinar el número de clases (K) también se pueden usar otras 
formulas tales como: 


K=Log 2(n) 
K= Vn 
NOTA-5 


Para determinar el número de clases para la tabla, el investigador 
puede utilizar el criterio anterior. 


2.6. Ejercicios Propuestos 


1. Una serie de 50 datos tiene como variable en estudio, los 
montos por ventas en miles de nuevos soles, siendo el 
monto mínimo 85 y el monto mayor 129. Establecer las 
clases para la tabla. 


2. Un conjunto de 50 datos tiene como variable en estudio 
los pesos de cajas, siendo el peso mínimo 43.43 Kg y el 
peso Máximo 68.15 Kg, Establecer las clases para la 
tabla. 


3. Los datos que a continuación se presentan, corresponden 
a una muestra aleatoria de 40 frascos conteniendo 
mermelada de fresa, el objetivo es estudiar su peso (grs.). 


149 164 171 176 181 185 187 190 
156 165 172 176 182 186 187 194 
157 165 174 178 183 186 188 196 
158 168 175 180 183 187 188 198 
162 170 175 180 184 187 189 202 
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a. Elaborar la tabla de distribución de frecuencias y 
hacer los gráficos correspondientes (histograma, 
polígono y ojiva), use la regla de Sturges 


b. Hallar e interprete M5 — H2, 1-Ha 


Usando la tabla de distribución de frecuencias; cual 
es el peso mínimo que debe tener un frasco, para 
estar considerado dentro del 15% de los de mayor 
peso. 


4, Los datos que presentan a continuación corresponden a 
una muestra tomada al azar de 50 personas, con el 
objetivo de estudiar la variable peso (Kg.): 


38.8 39.7 398 421 426 428 429 439 446 45.3 45.9 
46.0 462 464 46.5 46.7 46.7 47.0 47.1 47.9 47.9 48.6 
490 495 495 495 503 508 513 51.3 51.3 522 52.3 


52.4 524 525 539 540 544 544 54.7 54.7 55.1 55.4 
56.8 58.0 582 593 62.7 63.3 


a. Elaborar la tabla de distribución de frecuencias. 
Usar regla de Sturges. 

b. Obtener el histograma de frecuencias absolutas y la 
ojiva. 

C. Calcular e interpretar: 

d. E Ps X, 

e. ¿Cuántos personas aproximadamente tienen un 
peso menor a 54 Kg? 

f. ¿Cuántos personas aproximadamente tienen un 
peso superior a 52 Kg? 

9. ¿Cuántos personas aproximadamente tienen un 
peso entre 45Kg. y 50 kg? 

h. ¿Qué porcentajes de personas tienen un peso 


inferior a 55 Kg?. 

l ¿Cual es el mínimo peso, para que una persona se 
encuentre considerado dentro del 30% de los que 
tienen mayores pesos? 
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5. 


Los datos que se presentan a continuación corresponden 
a los ingresos (nuevos soles) de 45 trabajadores tomados 
al azar de una empresa. 


695.7 
797.3 
833.6 
889.6 


922.3 
976.0 


Con 


721.8 728.0 735.7 752.9 758.3 761.2 780.1 
805.0 817.5 819.2 822.6 830.1 831.3 831.6 
842.0 842.1 8449 847.1 869.3 880.7 883.9 
895.8 896.8 897.4 899.0 919.8 920.9 921.5 


929.4 929.9 9343 937.0 946.6 963.9 966.8 
977.8 980.2 992.2 1001.9 


Elaborar la tabla de distribución de frecuencias. 
Usar la regla de Sturges. 


Obtener el histograma de frecuencias absolutas y la 
ojiva. 
Hallar e interprete. 
FF F -F Xx 
3 4 h] 2 3 


¿Cuántos trabajadores aproximadamente tienen un 
ingreso menor a S/. 750? 


¿Cuántos trabajadores aproximadamente tienen un 
ingreso superior a S/. 850? 


¿Cuántos trabajadores aproximadamente tienen un 
ingreso entre S/.850 y S/. 950? 


¿Qué porcentajes de trabajadores tienen un ingreso 
inferior a 850 Kg. 


¿Cuál es el mínimo ingreso, para que un trabajador 
este considerado dentro del 30% de los que tienen 
mayores ingresos? 


la finalidad de realizar un estudio acerca de la 


cantidad (centenas de Kg) de arroz vendida por semana 
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en una tienda comercial, se tomó una muestra de 40 
semanas, obteniéndose los siguientes resultados. 


0.47 0.79 1.36 1.46 1.51 1.65 1.67 1.82 1.95 2.05 
2.09 2.12 2.16 2.24 225 2.27 230 2.36 2.47 2.48 


2.65 2.67 2.80 2.89 2.91 3.01 3.06 3.20 3.23 3.27 
3.36 3.51 3.56 3.60 3.69 3.72 3.89 4.15 4.47 5.15 


a. Construya la tabla de distribución de frecuencias, 
utilizar Sturges para determinar el número de 
clases. 

b. Hallar e interprete: 

Vd F F -—F E 
3 4 5 2 3 

G: Calcular e interprete en término del enunciado los 
valores de la media, mediana y moda. 

d. De la tabla de distribución de frecuencias, estime en 


cuantas semanas de ese año, se vendieron por lo 
menos 200 Kgs, de arroz pero no mas de 350 Kg. 

e. De la tabla de distribución de frecuencias. ¿entre 
que valores se encuentra el 70% central de la 
cantidad de arroz vendido?. 


Le Se tienen conocimiento que una máquina de tejer está 
trabajando mal, con la finalidad de conocer el numero de 
fallas por chompas se extrae una muestra aleatoria de 50 
chompas y se contabiliza en numero de fallas, los 
resultados se presenta a continuación: 
2 1 1 0 0.0 1 0 4 0 
5 2 5 1 4 1.5.3 2 3 


2 2 2 2 2 5 2 5 1 0 
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a. Elaborar la tabla de distribución de frecuencias 
b. Visualizar la tabla a través de gráfico. 
C. Hallar e interprete: 

K Fa 


Los siguientes datos corresponden a la preferencia sobre 
color de pantalones que usan las alumnas de la Pontifica 
Universidad Católica del Perú, una muestra aleatoria de 
tamaño 30 alumnas, da los siguientes resultados: 


Azul Rojo Azul Azul Beige Verde 
Verde Verde Rojo Blanco Blanco Negro 
Negro Negro Negro Verde Verde Verde 
Verde Verde Marrón Marrón Marrón Blanco 
Rojo Beige Azul Negro Marrón Beige 


a. Elaborar la tabla de distribución de frecuencias e 
interpretar. 
b. Realice el GRAFICO correspondiente. 


En una encuesta realizada a 50 familias, en la cual la 
variable en estudio es el número de integrantes de las 
familias; los resultados son: 


3.5 6 3 4 5 6 3 5 4 
3.5 4 3 4 5 3 4 5 2 
34 5 3 5 4 3 5 4 3 
34 5 4 3 2 6 5 4 4 
2 2 4 5 5 5 5 3 4 6 
a. Elaborar la tabla de distribución de frecuencias 
correspondiente 
b. Hallar e interprete las clases formadas. 


Los montos diarios por ventas de una tienda comercial en 
miles de nuevos soles se presentan a continuación. 


1.23 1.25 1.26 1.28 258 256 248 2.56 2.56 2.78 


256 3.25 3.25 1.25 2.35 425 235 426 4.28 4.29 
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435 436 2.58 1.68 1.59 156 1.58 1.67 2.70 2.89 
230 256 2.89 1.89 1.56 1.89 156 158 1.57 1.25 


123 123 258 247 231 256 456 3.25 3.24 3.25 
3.78 356 3.01 3.25 3.89 


a. Elaborar la tabla de distribución de frecuencias 

b. De la tabla de distribución de frecuencias, cuantos 
montos por ventas aproximadamente, son 
superiores a los 2,000 nuevos soles 

C. De la tabla de distribución de frecuencias, cuantos 
montos por ventas aproximadamente se encuentran 
entre 2,500 nuevos soles y los 4,000 nuevos soles. 


d. ¿Que porcentajes de los montos por ventas son 
superiores a los 3,000 nuevos soles. 
e. ¿Cuál es el mínimo monto por venta, para que una 


venta este considerado dentro del 25% de los 
mayores montos. 


11. Los siguientes datos corresponden a los tiempos en 
minutos, necesario para que 50 clientes de un banco 
comercial lleven a cabo una transacción bancaria: 


23 24 33 18 78 31 24 04 42 63 
02 44 97 47 08 3.7 46 13 12 7.6 
29 58 25 07 09 72 3.8 11 05 14 


04 28 56 62 04 16 15 55 68 05 
28 33 95 12 13 19 27 34 52 14. 


a. Construir la tabla de distribución de frecuencias 

b. Construir la Ojiva 

G. ¿Qué Porcentajes de los tiempos en atención al 
cliente son superior a los 3 minutos. 

d. ¿Que porcentajes de los tiempos de atención al 


cliente se encuentra entre 2 y 4 minutos. 
12. Los siguientes datos corresponden a los montos de 


ventas, en miles de nuevos soles, de 30 vendedores de 
una compañía de computadoras. 
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455 328 489 51.2 895 709 85.2 70.5 65.8 60.4 


40.2 293 35.6 882 429 26.9 28.7 99.8 35.6 37.8 
442 323 55.2 50.6 25.4 31.7 368 45.2 25.1 39.7 


a. Construir la tabla de distribución de frecuencias 

b. Construir el histograma de frecuencias y la Ojiva 

C. ¿Qué porcentaje de las ventas son superiores a los 
S/.50,500 


13. Los siguientes datos corresponden a los resultados de una 
encuesta tomada a 50 usuarios sobre los servicios que 
brinda la biblioteca de cierta universidad. 

B= bueno R= regular M= malo 


B|IB|R|ÍB|JM|R|R|B|B|R 
RIB|R|[B|[M|R|R|B|RI|R 
RIM|IR|R|B|R|R|M|RI|B 
B| B BIR|IB|B|B | M|B|B 
BI|IM|R|B|M|R|R|B|RI|B 

a. Elaborar la tabla de distribución de frecuencias e 
interpretar. 

b. Realice los gráficos correspondientes. 


14. La tabla de distribución de frecuencias, corresponde a las 
edades (años) de usuarios que concurren a un centro de 


información 
Edades F; 

18-21 3 
21-24 9 
24-27 21 
27-30 39 
30-33 59 
33-36 69 
36-39 76 
39-42 80 
Total 

a. ¿Qué porcentajes de las edades de los usuarios 


son superiores a los 25 años? 


86 


EsTADÍSTICa DESCRiptiva y prOBABILIDAd pARa LAs CIENCIAS DE LA INFORMAción CON El USO DE] spss 


b. ¿Entre que edades se encuentran el 80% central de 
las edades de los usuarios? 
Cc; ¿Cual es la máxima edad para que un usuario se 


encuentre considerado dentro del 20% de los 
usuarios que tienen menores edades, y cuántos son 
aproximadamente? 


15. La siguiente tabla de distribución de frecuencias, 
corresponde a los montos por ventas en miles de nuevos 
soles, de 50 tiendas comerciales dedicadas a la venta de 
abarrotes durante un mes. Si los montos por ventas se 
agrupan en 5 clases de ancho fijo igual a 5000. 


Montos por Es h. F, | BH, Xx; 
ventas E 
5 21,000 
17 
35 
45 
50 
Total 
Encuentre: 
a. Complete la tabla. 
b. ¿Qué cantidad de ventas aproximadamente son 
inferiores a 30,000 nuevos soles? 
6: ¿Cuál es el mínimo monto por venta, para que una 


venta se encuentre considerado dentro del 25% de 
las ventas mayores? 

d. ¿Entre que valores se encuentran el 80% central de 
los montos por ventas? 


16. La siguiente tabla de distribución de frecuencias 
corresponden a las edades de 30 usuarios de un centro de 


información: 
Edades f hi F; H; Xx. 
1 
[ - ) 0.2 23 
¡NN 0.5 27 
[ - ) 0.2 
[.=-3 
Total 30 
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17. 


H,- H. 
Hallar e interprete: La ha, 4 2 


¿Qué cantidad de usuarios aproximadamente tienen 
edades inferiores a los 29 años. 

¿Qué cantidad de usuarios aproximadamente tienen 
edades superiores a los 30 años 

¿Qué cantidad de usuarios aproximadamente tienen 
edades entre 23 y 27 años. 

¿Qué Cantidad y % de usuarios tienen edades 
superiores a los 27 años? 

¿Cual es la mínima edad, para que un usuario se 
encuentre considerado dentro del 20% de los que 
tienen edades mayores? 


La tabla de distribución de frecuencias corresponde a los 
tiempos que tarda un pedido realizado por los usuarios 
que concurren a una biblioteca. 


Tiempo f hi Fi H; 
(minutos) 
[2 - 4) d 
[a - 6) 16 
[6 E 8) 32 
[8 - 10) 44 
[10 — 12) 50 
Total 
a. ¿Qué cantidad de usuarios reciben un pedido en 
menos de 3 minutos 
b. ¿Qué cantidad de usuarios aproximadamente 
reciben un pedido después de los 6 minutos. 
C. ¿Qué cantidad de usuarios aproximadamente 
reciben un pedido entre los 4 y 10 minutos. 
d. ¿Que cantidad y porcentaje de usuarios reciben su 
pedido entre 5 y 9 minutos? 
e. ¿Que cantidad y porcentaje de usuarios reciben su 


pedido antes de los 5 minutos o después de los 9 
minutos? 
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18. La menor edad de los usuarios que concurren a un centro 
de información es de 18.5 años y la mayor es de 41.3 
años, si la cantidad de datos de la muestra es 70, 
establecer los intervalos de clases. 


19. La menor edad de los usuarios que concurren a un centro 
de información es de 16 años y la mayor es de 50 años, si 
la muestra es de tamaño 85. Establecer los intervalos de 
clases. 


20. Una muestra de 60 alumnos arroja que la estatura menor 
es de 1.64 mts, y la mayor 1.72 mts. Establecer los 
intervalos de clases. 


21. Una muestra de 90 alumnos arroja que la estatura menor 
es de 1.63 mts, y la mayor 1.74 mts. Establecer los 
intervalos de clases. 


22. Una muestra de 70 tiendas comerciales arroja que el 
menor monto por venta recaudado es de S/.4,300 y el 
mayor S/.23, 


23. Una muestra de 50 alumnos arroja que el peso menor es 
de 64.5 Kg y el mayor 80.5 kg. Establecer los intervalos 
de clases. 


24. La siguiente tabla de distribución de frecuencias 
corresponde a las edades de 50 usuarios que concurren a 
un centro de información: 


Edades Ji hi F; H; E 
[ ) 0.04 20 
[ - ) 0.16 24 
[ = ) 0.40 28 
[ - ) 0.24 
[ _ ) 0.10 
[ - ) 0.06 

Total 
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25. 


27. 


ha H,-H 
Calcular e interprete: Lo 45 5 2 


¿Qué Cantidad y % de usuarios tienen edades 
inferiores a los 32 años? 
¿Qué Cantidad y % de usuarios tienen edades 
superiores a los 27 años? 
¿Cuál es la mínima edad para que un usuario se 
encuentre considerado dentro del 20% de los que 


tienen edades mayores? 


Los datos de la tabla, tiene como variable en estudio la 
edad de estudiantes (años) 


Completar la tabla de distribución de frecuencias 


Calcular e interpretar: %4 


y H; 


Edad(años) f h, F, H, x, 
14 
0.4 0.56 18 
12 
8 
2 
Total 


La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio al número de hijos. 


X=número 


de hijos Í h, F; H, 
1 0.1 
2 0.2 
3 28 
4 14 
5 7 
Total 


Completar la tabla de distribución de frecuencias 
y H, 


La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio los montos por ventas registrados 


Calcular e interpretar: 


durante 58 días por una tienda comercial. 
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X=montos por 
ventas ( 3) Í h, F, H; ES 
4 900 
14 1100 
26 
46 
54 
58 
Total 
a. Completar la tabla de distribución de frecuencias 


b. Calcular e interpretar: fa, Rh», Hs Ha, *; 


28. Una tienda comercial registra durante 50 días los montos 
por ventas; siendo el monto menor S/.320.5 y el mayor es 
de S/.1236.4. Con esta información establecer las clases 
para elaborar la tabla de distribución de frecuencias. 


29. Sea la tabla de distribución de frecuencias 


Edad de 
estudiantes Í h, F, H, X; 
(años) 
0.10 22.5 
0.18 27.5 
10 32.5 
12 
10 
4 
Total 


Completar la tabla 

¿Qué porcentaje de estudiantes, tienen edades superiores 
a los 32 años? 

C. ¿Qué porcentaje de estudiantes, tienen edades entre los 
27 y 42 años? 


gp 
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CAPÍTULO 3 


INTRODUCCIÓN 

En este capítulo se estudia las principales medidas de tendencia 
central o de posición, las cuales se definen como aquellos valores que 
representan al conjunto de datos de la variable en estudio para la 
muestra o población. Se calculan para datos agrupados y no 
agrupados, así como también sus propiedades. 


3.1. MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN 

Son valores estadísticos calculados con los datos de la muestra o de la 
población y que tienden a ubicarse en el centro de la distribución de los 
datos. A estas medidas se les considera como valores representativos 
para el conjunto de datos. 


Si estos valores son calculados usando los datos de la muestra, se les 
llama valores estadísticos, estadígrafos o estimados; en cambio si son 
obtenidos usando los datos de la población, se les llama parámetros. 


Las medidas de tendencia central mas usadas son: 
La media aritmética o simplemente media. 
La media ponderada 

La mediana 

La moda 

La media Geométrica 

La media Armónica 


OUEN 


3.2. LA MEDIA ARITMÉTICA 


Es un valor que tiende a ubicarse en el centro de la distribución 
de los datos, y es considerado un valor representativo para el 
conjunto de datos cuando los datos presentan poca variabilidad. 
Su valor se calcula tanto para la muestra (valor estadístico) 
como para la población (parámetro). Cuando la media aritmética 
se calcula utilizando datos que no se encuentran en una tabla de 
distribución de frecuencias, se dice que la media aritmética se 
obtuvo para datos sin agrupar, en caso contrario la media 
aritmética se obtuvo para datos agrupados. 
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. LA MEDIA ARITMÉTICA PARA LA POBLACIÓN 


Sea X una variable en estudio que toma valores 


a O O e ed de 
P22>73>N la media aritmética para la población se 


simboliza universalmente con la letra griega pl (se lee “mu”) y 
es igual a la sumatoria de todos los datos de la población 
divididos por el total de ellos. 


N 
NA 
p= 
NOTA: El valor de la media aritmética para la población existe, pero 


casi nunca se conoce, el objetivo es estimar su valor, a través de la 
media aritmética muestral. 


Ejemplo: 


Supongamos que se tienen todos los pesos en kg de 3,546 varones 
adultos de una empresa minera, siendo estos: 


655 705 695 700 710. , .68.5 
Calcular e interpretar la media aritmética poblacional. 


3546 


ds 65.5+70.5+69.5+70+71+...+68.5 


ri -68.2k 
H=3546 3546 il 


68.2 Kg. Es el peso promedio representativo para todos los 
trabajadores de la empresa (parámetro), esto significa que existen 
datos con pesos inferiores o superiores al valor de la media aritmética. 


" LA MEDIA ARITMÉTICA PARA LA MUESTRA 


Ml do 


Se X una variable en estudio que toma valores 
la media aritmética para una muestra se simboliza 
universalmente con la letra x ( se lee x-barra) y su valor esigual 
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a la sumatoria de todos los datos de la muestra divididos por el 


total de ellos. 


x=. 
Y 


Es la media aritmética para datos sin agrupar. Al valor de la 


media aritmética, también se le conoce como la media aritmética 
muestral. 


Ejemplo 


Los siguientes datos corresponden a los pesos (kg), de 8 personas 
adultas de sexo varón: 


60.5 685 585 705 70.0 685 72.0 71.0 
Calcular e interpretar la media aritmética. 

X. 
E 60.5+68.5+58.54+70.5+70+68.54+72+71 


E = 67.4Kg. 
Xx 6 E Eg 


Interpretación: 


67.4 Kg, es el peso promedio de los 8 varones adultos, este valor 
representa a cada peso de los 8 varones; esto significa que existen 
pesos inferiores o superiores al valor de la media aritmética. 


" PROPIEDADES DE LA MEDIA ARITMÉTICA MUESTRAL 


La media aritmética para la muestra, tiene las siguientes propiedades: 


T Sea Xj, X2) X3 ,».., X,, una muestra de tamaño “n” yx, la 
media aritmética, definimos a una desviación como la diferencia 
entre un dato cualquiera x; y su media aritmética x ; es decir: 


di=Xi —X 
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Entonces la sumatoria de todos los valores d, es igual a cero; 
esto es: 


Ya =»Ma,-3=0 
i=1 i=1 


2. La suma de los cuadrados de las desviaciones con respecto a la 
media aritmética, es siempre un valor mínimo; es decir, 


2_ 
Sd = Y (x -x? >0, es siempre un valor 
mínimo. 


3. Sea x1, x2,X3,..., Xn, una muestra de tamaño “n” y X , la media 
aritmética, sea la combinación lineal y;¡=ax;+ b ; entonces la 
media aritmética para variable Y es: 


Y=aXtb 


4. Sea una muestra de tamaño “ n”, dividida en “k” subomuestra de 


tamaño 2M¡M),,..My, Y Xt, X2 ,...,Xk > las medias 


aritméticas de cada submuestra; entonces la media aritmética 
de la muestra de tamaño de tamaño » , se calcula por: 


a esta media aritmética se le conoce como la media ponderada. 
. LA MEDIA ARITMÉTICA PARA DATOS AGRUPADOS 
Cuando los datos se encuentran en una tabla de distribución de 
frecuencias la media aritmética se calcula de la siguiente formula: 
le ' 
xf 
X= El 


n 
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donde: 


k = Número de clases 
x, = Marca de clase ¡-ésima clase( corresponde a la ponderación) 


f;= Frecuencia absoluta de la i-ésima clase 


Otra formula que se puede utilizar para calcular la media aritmética 
para datos agrupados, es en función de las frecuencias relativas: 


x= Yxh 
ii 
El 
Nota: 


Las propiedades de la media aritmética para datos sin agrupar, 
se cumplen también para datos agrupados. 


Ejemplo 
ea la tabla para los datos agrupados de los pesos (kg) de los recién 
Sea la tabl los d dos de | (kg) de | ¡é 
nacido. 
L | Peso | £l h (FE | .qH|X 
l 
1 [14 -1.8) 2 5.88% 2 5.88% | 1.60 
2 [1.8 2.2) 4 11.76% 6 17.64% | 2.0 
3 [2.2 2.6) 4 11.76% 10 | 2940%| 24 
4 [2.6 -3.0) 5 14.71% 15 | 4411%| 28 
5 [3.0 e 4) 10 29.42% 25 |73.53%| 3.2 
6 [3.4 -3.8) 7 20.59%| 32 | 9.12%| 3.6 
7 [3.8 4.2) 2 5.88% 34 100% 4.0 
TOTAL 34 100.0% 
Hallar e interprete la media aritmética: 
+ Z 1.60(2)+2.0(4) +2.4(4) +2.8(5) +3.210)+3.6(7) + 4(2) -2.94Kg. 
n 7 34 
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Interpretación: 


2.94 Kg. Es el peso promedio representativo para los 34 recién 
nacidos de la maternidad de Lima. Significa que en la muestra 
existen pesos inferiores o superiores al valor de la media 
aritmética. 


VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMÉTICA 


Ventajas 

a. Es fácil de calcular e interpretar su valor 

b. Su fórmula se presta a manipulaciones algebraicas 

C. La suma de las desviaciones es cero 

d. La suma de las desviaciones al cuadrado siempre es mínima 

Desventajas: 

a. Su valor se encuentra afectados por datos extremos (datos muy 
altos o datos muy bajo); es decir estos datos tienden a alterar su 
valor. 

b. Deja de ser un valor representativo para la muestra cuando los 
datos presentan mucha variabilidad o dispersión. 

6. No se puede calcular en tabla de distribución de frecuencias con 
extremos abiertos. 

d. Para datos con distribución asimétrica, no debe usarse como 
medida representativa. 

3.3. LA MEDIA PONDERADA 


Sea X una variable en estudio que toma los valores X1,X2,...,Xn y sea 
los pesos o ponderaciones asociada a cada valor de la variable 
W1,W2,..., Wn, la media ponderada es definida como: 
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Si la ponderación es igual para todos, la media ponderada es igual a la 
media aritmética sin ponderar. 


Ejemplo: 


En una empresa compuesta por 300 trabajadores, el ingreso mensual 
es como sigue: 250 de ellos son obreros y ganan $ 850.00, 40 
trabajan en la administración y ganan $ 950.00 y el resto son 
profesionales y ganan $ 1500.00. Hallar e interprete el ingreso 
promedio para los trabajadores de la empresa. 


El enunciado presentado en la tabla: 


i Trabajadores Ponderación(w;) | sueldo( x;) 

1 Obreros 250 850.00 

2 Administrativos 40 950.00 

3 Profesionales 10 1500.00 
Total 300 


y W:%;  250(850.00) + 40(950.00) + 10(1500) 
El 


X, = _ = $ 885.00 
po y en = 250+40+10 
El 
Interpretación: 


$.885.00, es el ingreso promedio para los trabajadores de la empresa. 


3.4. LA MEDIANA 


Es una medida de tendencia central, que divide al conjunto de 
datos ordenados de la muestra, en dos partes iguales; es decir el 
50% de los datos tendrán valores menores o iguales al valor de 
la mediana y el otro 50% de los datos con valores superiores al 
valor de la mediana. 


. CÁLCULO DE LA MEDIANA PARA DATOS SIN AGRUPAR 
Sea X una variable en estudio que toma los valores 


Xi) Xz 00.» Ay , para calcular el valor de la mediana, se 
ordenan los datos en magnitud en forma ascendente o 
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descendente, para calcular la mediana debemos tener en cuenta 
si el número de datos es par o impar; es decir: 


x +x 
(5 +) 
ñ= par=>me=1"* (1) 
2 
n = impar > me =X n41 (2) 
( 
2 


Donde: 


Xi) = valor que toma la variable X en la posición 


El valor de la mediana es útil como medida representativa para el 
conjunto de datos, cuando estos no tienen un comportamiento 
homogéneo. 


Ejemplo-1 


La cantidad de estudiantes que concurren a un centro de información 
durante la semana es: 


230 220 250 228 240 1200 
Hallar el valor de la mediana de la concurrencia de estudiantes 
Ordenando los datos en forma ascendente: 

220 228 230 240 250 1200 
Utilizando la fórmula (1), por tener un número par de datos 


Ya FXa 2304240 
2 


n=6>me= =2353 estudiantes 
Interpretación: 
El 50% de los estudiantes que concurren al centro de información 


durante los días de la semana es menor o igual a 235, y el otro 50% de 
los estudiantes es superior a 235. 
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Ejemplo-2 
Sea la serie de datos: 5, 3, 2, 1, 2, 5, 4, 3, Hallar la mediana 
Ordenando los datos en forma ascendente:: 1,2,2,3,3,4,5,5 


Como n = 8 (número de datos par), entones: 
Ma+x _3+3 
me = EPS 


2 2 
Interpretación 


El 50 % de los datos son menores o iguales a 3 y el otro 50 % son 
superiores a 3. 


Ejemplo-3 


Hallar e interprete el valor de la mediana para las estaturas (mts) de 7 
personas adultas. 


1.71 169 1.72 1.69 168 1.70 1.73 
Ordenando las estaturas: 


168 169 1.69 1.70 1.71 1.72 1.73 


Comon=7, entonces: Mé= “% 7+ NN X4=1.70 
Interpretación: 

El 50 % de las personas adultas tienen estaturas menor o iguales a 
1.70 mts, y el otro 50 % de los Cadetes tienen estaturas superior a 
1.70 mts. 

. CÁLCULO DE LA MEDIANA PARA DATOS AGRUPADOS 


PARA UNA VARIABLE CUANTITATIVA DISCRETA Y 
CONTINUA 


PARA UNA VARIABLE CUANTITATIVA DISCRETA 
Ejemplo 
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En la siguiente tabla de distribución de frecuencias, la variable en 
estudio X corresponde al número de balones de gas vendidos 
diariamente por 50 tiendas. Hallar el valor de la mediana del 
número de balones de gas vendido diariamente. 


Xi Fi 
22 9 
23 10 
21 6 
25 7 
26 5 
24 13 
TOTAL 50 


Ordenando (de menor a mayor) los valores que toma la variable X, y 
obtenemos el valor de las frecuencias absolutas acumuladas. 


l 6 a F; 
1 21 6 6 
Pl 22 9 15 
3 23 10 25 (X16 —> Xas) 
4 24 13 38 (X26 > X38) 
5 25 7 45 
6 26 5 50 
TOTAL 50 


Xa5 FX5 23424 


2 2 


n= 50( par) >me= =23.5 


Interpretación: 

El 50% de las tiendas tienen una venta diaria menor a igual a 23.5 
balones de gas, y el otro 50% de las tiendas tienen una venta diaria 
mayor a 23.5 balones de gas. 

PARA UNA VARIABLE CUANTITATIVA CONTINUA 


Cuando los datos se presentan en una tabla de distribución de 
frecuencias, para una variable continua, el valor de la mediana se 
calcula haciendo uso de la siguiente formula: 
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añ 


me = Ll, 


| 
4 (2 YA 


Donde: á 
LI ¡=Limite inferior de la clase que contiene al valor de la mediana 


F;-1 =Frecuencia absoluta acumulada de la clase anterior a la clase 
que contiene al valor de la mediana 
f ¡=Frecuencia absoluta de la clase que contiene al valor de la 


mediana 
A =Ancho del intervalo de clase. 
Para ubicar la clase que contiene el valor de la mediana se busca en la 
columna de la frecuencias absoluta acumulada o frecuencias relativa 
acumulada (F; o H;,) el primer valor que sea mayor o igual a la 
mitad del número de datos o al 50% de los mismos; es decir, 


n 
F 2 
2 
Otra fórmula que se puede utilizar para calcular la mediana para 
datos agrupados, en función de las frecuencias relativas: 


Ly A 


a) = 
mii 


Fl 


Ejemplo-1 
Hallar e interprete el valor de la mediana para la tabla de datos 
agrupados de los recién nacidos. 


¡| Pesos | f | hi (FF, | H|X, 
1 [[14-138) 2 | 588% | 2 | 5.88% | 1.60 
2 [1.8 _ 2.2) 4 11.76% 6 17.64% 2.0 
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3 |[22-26) 4 | 11.76% | 10 | 2940%| 24 

4 ([26-3.0) 5 | 14.71% | 15 | 44.11% | 28 

5 [3.0 7] 4) 10 29.42% 25 73.53% 3,2 

6 [3.4 -3.8) E 20.59% 32 94.12% 3.6 

E [3.8 = 4.2) 2 5.88% 34 100% 40 
TOTAL 34 100.0% 


7 34 
F2 >F2  >F >17,entonces la 5ta clase contiene al valor de 


i Dd i 2 i 
la mediana (i=5) 
n 
17-15 
me=r HEAR X(0.4) = 3.08Kg. 
E e Co 
Interpretación: 


El 50% de los recién nacidos tienen pesos menores a iguales a 3.08 Kg 
y el otro 50% de los recién nacidos tienen pesos superiores a 3.08 Kg. 


n VENTAJAS Y DESVENTAJAS DE LAMEDIANA 
Ventajas 


Es fácil de calcular e interpretar su valor 

Se realizan manipulaciones algebraicas. 

Su valor no se encuentra afectado por datos extremos. 

Se puede calcular en tablas de distribución de frecuencias con 
extremos abiertos 


A 


Desventaja 
La suma de los cuadrados de las desviaciones con respecto a la 
mediana no es mínima, en comparación con la media aritmética. 


. PROPIEDADES DE LA MEDIANA PARA UN CONJUNTO DE 
DATOS TRANSFORMADOS 


Mn 


Sea X1,X2 ,X3 ,..., Xn , Una muestra de tamaño “"n" y M, el valor de 


la mediana, sea la combinación lineal y;¡= ax;+ b ; entonces el nuevo 
valor de la mediana para la variable Y es: 
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m =am ib 


e, ex 


Siendo:a y b constantes. 
Ejemplo-1 
Un conjunto de 20 datos tiene por mediana 24, si al conjunto de datos 
se le incrementa en un 15% más 3 unidades. Hallar el nuevo valor de la 
mediana. 


Sea el x;, valor del i-esimo datos, por el enunciado del problema el 
valor del iesimo dato transformado es yi=1.15x:+3 y por la 
propiedad de la mediana, su nuevo valor es: 


m =1.15(24)+3=30.6 


Ejemplo-2 

Sea la tabla de distribución de frecuencias 
Edad fi F; X, 
18-22 4 4 20 
22-26 13 17 24 
26-30 19 36 28 
30-34 12 48 32 
34-38 5 53 36 
Total 53 


De la tabla, si las edades de las 53 personas se incrementan en un 
12% mas 2 años, calcular el nuevo valor de la mediana. 


De la tabla calculamos el valor de la mediana. 


E O 


A 19 
Seael x; , valor de la i-ésima marca de clase para la tabla, por el 
enunciado del problema el valor de la i-ésima marca de clase 
transformada es y =1.12x +2 y por la propiedad de la mediana, 

i i 


su nuevo valor es: 
m =1.12m+2=1.12(28)+2 = 33.36 años 


€, 
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3.5. LAMODA 


Sea X una variable en estudio que toma los valores 
X1 , X2 ,...» Xn , la moda, es aquel valor de la variable que se 
presenta con mayor frecuencia, se representa por (mo. ); es decir, 


mo = valor que toma la var ¡able para la max ima frecuencia ( f;) 


El valor de la moda se interpreta como el valor mas frecuente 
para el conjunto de datos de una muestra o población. 


El valor de la moda puede o no existir. Si un conjunto de datos 
tiene una sola moda a su distribución se le llama unimodal, si 
tiene dos modas se le llama bimodal y para más modas 
multimodal 

Ejemplo-1 

Hallar la moda para el conjunto de datos 


12, 16, 18, 18, 18, 20, 20, 20, 20, 20, 20, 24 


El dato que se repite con mayor frecuencia es el valor 20, luego la 
moda es 20. 


Ejemplo-2 
Calcular la moda para la serie de datos 
1,1,1,3,3,4,3 


Los datos que se repiten con igual frecuencia son el 1 y 3, luego la 
distribución tiene dos modas 1 y 3. 


Ejemplo-3 
Calcular la moda para el conjunto de datos: 4, 2, 3, 7,5, 9 


Como no existe ningún dato que se repite más de una vez, luego el 
conjunto de datos no tiene moda. 
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Ejemplo-4 


Una tienda vende durante el día tres tipos de conservas: 120 frascos 
con fresa, 40 frascos con durazno y 50 frascos con piña. Calcular el 
tipo de conserva más vendida. En este ejemplo la variable en estudio 
es tipo de conservas; luego los frascos con fresas registraron la mayor 
frecuencia en venta 


. CÁLCULO DE LA MODA PARA DATOS AGRUPADOS 


Cuando los datos se encuentran en una tabla de distribución de 
frecuencias, la formula para calcular la moda es: 


d 
mo=LI +(_ > JA 
" di+d) 


Donde: 


LT ¡= Limite inferior de la clase que contiene al valor de la moda. 


di= fi- fe = Diferencia entre la frecuencia absoluta de la 
clase modal y la frecuencia absoluta de la clase 
anterior. 

de = fi — fir1 = Diferencia entre la frecuencia absoluta de la 
clase modal y la frecuencia absoluta de la clase 
siguiente. 

A = Ancho de clase 


La clase modal corresponde a la clase de mayor frecuencia absoluta o 
mayor frecuencia relativa. 


Otra fórmula que se puede utilizar para calcular la moda para datos 
agrupados, es an tarción de las frecuencias relativas: 
n 
mo=LI +( JA 
diln+d,/n 


LT ¡= Límite inferior de la clase que contiene al valor de la moda. 
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d, 


= h 
dE Re e Diferencia entre la frecuencia relativa de la 
clase modal y la frecuencia relativa de la clase 
anterior. 
dle n 
ES o Diferencia entre la frecuencia relativa de la 
i i+l 
n 


clase modal y la frecuencia relativa de la clase 
siguiente. 


La clase modal corresponde a la clase de mayor frecuencia relativa. 


Ejemplo 


De la tabla de distribución de frecuencias, en la cual se analiza los 
pesos de los recién nacidos. Hallar e interprete el valor de la moda. 


l | Peg | f£| h F|H|X 


Í i i i 


' [[L4-13) 2 5.88% 2 [| 5.88% | 1.60 
2 [[18-2.2) 4 [| 1176% | 6 | 17.64% | 20 
3 [[22-26) 4 | 1176% | 10 |2940% | 24 
4 [[2.6-3.0) 5 1 1471% | 15 | 4.11% | 28 
5 1.034) 10 [| 29.42% | 25 | 73.53% | 32 
8 [[543.8) 7 20.59% | 32 | 94.12% | 36 
7 [3.8-42) 2 5.88% | 34 | 100% | 4.0 
TOTAL 34 | 100.0% 


El valor de la moda se encuentra en la 5ta clase, por presentar la 
máxima frecuencia absoluta, en este caso la distribución es unimodal 
para esta muestra, luego (i = 5) 


d=f=Ja=Js=/f=10=3=5 


de = fi fa= f-f=10-7=3 
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3 


mo=LI + e JA=3+( ) * 0.4 = 3.25Kg. 
5 


dí +d» 5+3 


Interpretación: 3.25 Kg. Es el peso mas frecuente para los recién 
nacidos. 


" PROPIEDADES DE LA MODA PARADATOS 
TRANSFORMADOS 


Sea X1,X2,X3,..., Xn , una muestra de tamaño “"n" de datos 
cuantitativos y m ,el valor de la moda, sea la combinación lineal 


y; = axi¡+ b ; entonces el nuevo valor de la moda para la variable Y 


es: 
m =am zib 


0, 0 


Siendo: a y b. constantes. 


3.6. LA MEDIA GEOMÉTRICA 


Es otra medida de tendencia central, y se utiliza cuando se desea 
promediar tasas de cambio o proporciones. Para un conjunto de 


datos X1,X2,X3,..., Xn, Vx,>0 la media geométrica se define 
como la raíz enésima del producto de las observaciones; es 


decir, 
Xg = YX, ).(% ).Q5 )...(,, ) 
_ 1 n 
E Antilog(, 202 Xi) 
Para datos agrupados la fórmula para calcular la media 


geométrica es: 


xp= AY A ) Ex) : f 
1 ' 


Xx ¿=Antilog(, f. log x; ) 
il 
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Siendo: X;= valor de la ¡-ésima marca de clase 


f =Valor de la i-ésima frecuencia absoluta. 


n=2f 


Ejemplo-1 

Una país tiene una población en el año 1980 de 8 millones de 
habitantes, en el año 1990 fue de 9.2 millones y en el año 2000 de 
10.58 millones. Hallar la población media para esos tres años y el 
incremento anual. 


Cálculo de la población media 


X.= 318 0.21(10.58) = 9.2 Millones de habitantes es la población 
media 


Cálculo del incremento anual promedio 


E 10 10.58 
MS 35, = pos =1.15 > 115% 


15% es el incremento anual promedio de la población para los 3 años. 


Ejemplo-2 


Las cantidades de artículos vendidos durante los años 1974 al 1976 
por la empresa DURAPLAS, se presenta en la siguiente tabla: Hallar el 
incremento promedio anual 


Años Cantidad producida Variación anual 
1974 200 

1975 400 2.0 

1976 600 1.5 


La variación anual promedio 


xs = 421.5) =1.7320 


El incremento anual promedio es 1.732-1=0.732 en % es 73.20% 
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Ejemplo-3 
Hallar el promedio geométrico de las siguientes cantidades 


8 40 200 1000 


x= (8), 40)(200/(1000) =89.4427 
Ejemplo-3 
Calcular el promedio geométrico de las siguientes cantidades: 


AN 8, 16, 32 
x ¿«= 40816062) = 11.314 


3.7. LA MEDIA ARMÓNICA 


Se utiliza para promediar razones que tienen dimensiones físicas, 
tales como km/hora, promediar el costo medio de artículos 
comprados con una cantidad fija de dinero. La media Armónica 
para n valores  x;> 0, se define como el recíproco de la media 
aritmética de los recíproco de los datos. 


NN n 

Na = 1 1 
O, E 
Xx *% xo 

Para datos agrupados 

Xa = n 

A L Í, 
a A id 

X; La + 


X 


Siendo: ¡ = valor de la i-esima marca de clase 


ei = valor de la frecuencia absoluta de la ¡-esima 
clase 
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Ejemplo-1 


Tres vehículos recorren cierto tramo de una autopista con las 
siguientes velocidades: 90 km/hora, 110 km/hora y 140 km/hora. Hallar 
la velocidad media. 


a = =109.7097km1 hora 
1,1 1 
+ ——+ 
90 110 140 
Ejemplo-2 


Una persona concurre a tres mercados para consultar el precio de un 
artículo determinado llevando consigo la suma de 24 nuevos soles. En 
el primer mercado pude comprar 4 artículos; en el segundo 5 artículos 
yen el tercero 6 artículos. Hallar el precio promedio del artículo. 


Cantidad de artículos que puede Precio unitario del articulo 


comprar con los 24 nuevos soles 


4 6.0 
5 4.8 
6 4.0 
Y = úl =5S/ .4.8 
e 1 1 
ds 
6 48 4 


S/. 4.8 es el precio promedio del artículo. 
Ejemplo-3 


Un representante del INEI, con la misma cantidad de dinero, compra en 
diferentes establecimientos cantidades de un mismo artículo, tal como 
se muestra en la tabla siguiente. Hallar el precio promedio del artículo 
en los diferentes lugares. 


Cantidad de artículo 


Precio unitario por 


Ene comprado artículo 
20 10 2 
20 8 2.5 
20 14 1.42857 
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3 
Xa= qq 1 =S/.1.875 
++ 


2 25 1.42857 


Ejemplo-4 


Sean a y b dos números enteros positivo, probar que: 


Demostración 

sean a y beR* 
Entonces: 

(da —JbyY 20 


a+b Za 
a+b=2, [yy 20 >a+b22. fqp > a abia (1) 


También 
E yo 
pa, vo sora A ES Lo. 2 DxS<x 
o AA "Jab > < NS (2) 
a b Vab a b Jab lab 
1,1 2 1,1 
a b a b 


Aplicando el SPSS para datos no agrupados Media, Mediana, Moda 
Definiendo las variables 
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$2 "Sin tulo! [ConjuntoDato=0] - 18M SPSS Statistics Editor de datos -.0 x 
Archivo Editar Ver Datos lranstomar Analizar Gráficos Uidades Ampliaciones Ventana Ayuda 


ECT ELIO ERPOSTO 


Nombre. Tipo | Anchura |Decimales Etiqueta Valores | Perdidos Cokimnas Alineación Medida Rol 
Peso_recie... Numénco 8 1 Peso recien na... Nimguna —— Ninguna 8 E Derecha — $ Escala Y Entrada 


¡Bl SPSS Statistics Processor está histo Unicade:ON 


Ingresando los datos 


UR sim titulo! [ConguntoDatos0] - IBM SPSS Statistics Editor de datos = -] x 
Arcmivo  Eónar ver Datos Iranstomar Ansizar Gráficos UMmdades  Amollaciones Ventana Ayuda 


ELEGANTE 


VisiDIE_1 de 1vanadios 


w 2 
2 32 
a 32 
2 32 
B 33 
an 33 
25 33 
25 34 
Ed 34 

(a 35 
2 36 
30 36 
E 37 
E] 37 
El 39 
en 41 


IBM SPSS Stabs8cs Processor está listo Unicode: ON 


Calculando la Media, La Mediana y la Moda 
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En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCPRITIVOS-FRECUENCIAS-pasar la variable 


Peso_recien_nacido a la casilla de la derecha-ESTADISTICOS-marcar 
media, mediana y moda-CONTINUAR-ACEPTAR 


3148 ca BLAIR A AE ¿ola 


| Peso_reci di Peso_secien_nac gy 


Visible 2 de 2 variables 


< | Yananles: 


pr : | 
A A e CS 
39 4 Peso recien nacido [Peso_recn_nacd. 
2 encendia car 
3 72 cuartos Y Meca 
W ptos de cone para: grupos iguales | | [Y/ Megiana illa) 
E > porcartios Y Jigad (sumo muestreo 
] Suma 
3 
ul 
E Los varas son puntos macs de gugos 
U 
jánaar — Min 
q ox omo 
$ Rango Error estándar media 
[E | [contnuar) [cancetar ) (_yuaa ) 
E 


T T 


2 32 
EE] 33 
a 33 
2 3 
25 34 
El] JA 
2 3 
29 35 


¡4 Mostrartablas de trecuencias 


Lseestar )| pegas) Bestantecer)_ Cancelar) pus 


Estadísticos 


Peso recien nacido 


N Válido 34 
Perdidos 0 
Media 2,921 
Mediana 3,100 
Moda 3,2 


Para el cálculo de la Media Geométrica, Media Armónica, con los 
mismos datos ya ingresados en el menú del SPSS escoger: 
ANALIZAR-INFORMES-RESUMENES DE CASOS- pasar la variable 
Peso_recien_nacido a la casilla de la derecha -ESTADISTICOS y 
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seleccionar media armónica, media geométrica y pasar a la casilla de 
la derecha-CONTINUAR-ACEPTAR 


a 
Archivo Edítar Ver Datos Iranslomar ánaliar Gráficos lidades Ampliaciones Ventana Apuda 


238 RN co AAA A AE ¿old 


Visible. 2 de 2 vañables 


Peso_reci di Peso_recien_nacido1 
$ en_nació var va var AAA AAA 
- rm el 1 ES Informe de resumen: Estadisticos x 
2 Estadisticos Estacisbgos de casilla 
7 Yanatles Eat, mesa Mega armónica | 
4 4 Peso recien nacido [Peso_recien... Medana Mega geométrica 
¿| | de Pesoracen nacidot Peso, sete Megana apuupaca 
Desv Error de meda 
6 rl | 
7 Minima | 
; Máximo | 
: 5) nn 
Primero 
10 Último 
" Desviación estándar 
12 Varianza 
a Cuntosis 
- Desv Emor de curtosis 
. Asimena 
15 Desv. Error de asimetría 
16 Porcentaje de la suma total 
m3 Variables de agrupación Porcentaje del N total 
LJ 
19 
20 
EN] 
ES (0) 
2 
2 
2 1] 
2% 
El] L 
28 Y Mostrar casos 
2 Y Limitarios casos a los primeras [100 
= ¡4 Mostrar sólo los casos válidos | 
xn 
= Mostrar los mimeros de caso 
z (contr) catar) ama] 
3 INC 


[an | / Escribe aquí para buscar 


IBM SPSS Statistics Processor está listo Unicode: ON 


Resúmenes de casos 
Peso recien nacido 
Media Media 
armónica geométrica 
2,748 2,839 


Para datos agrupados 
Se elabora la tabla de frecuencias para datos agrupados: 


4. Cálculo del Rango” R“. 
R = peso mayor —peso menor. 


R =4.1-15=2.6 
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5. Cálculo del número de clases (K). 


K=1+3.3Log(34) = 6.05388 


Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 


OBSERVACIÓN 


El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o igual a 5, entonces la cifra 
entera del número se incrementa en una unidad. 


Ejemplo: 


Si, K= 6.7, usando el redondeo simple K = 7; 
Si, K= 6.4, usando el redondeo simple K = 6; 


6. Cálculo del ancho del intervalo de clase (A) 
El ancho del intervalo de clase se obtiene a través de la siguiente 
fórmula: 
R 
A= 
K 
Para los datos se tiene: 


a=% 2282043333 


K 6 
El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 


A =0.4 

E=AK-R=0.4(6) - 2.6 = 0.2 

Como el error es negativo, se debe incrementar en una clase 
más(k=7) 


A=28_0a4 


Ej 


E=AK-—R=0.4(7) - 2.6 = 0.2 


Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 
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aa Y 


2 2 
En el menú del SPSS, escoger la opción TRANSFORMAR- 
RECODIFICAR EN DISTINTAS VARIABLES-pasar la variable peso- 
recién-nacido al casillero de la derecha, en la derecha en donde indica 
variable de salida Nombre: poner peso_recien_nacido1 y en la etiqueta: 
poner Peso _recien_nacidol —- PRESIONAL LA OPCION CAMBIAR- 
VALORES ANTIGUOS Y NUEVOS-RANGO-poner desde 1,4 hasta 1,8, 
luego en VALOR poner 1 y AÑADIR, así sucesivamente continua con 
todos los rangos de 3,8 hasta 4,2. 


valor de arranque= dato menor — 


a 


Archivo Ecitar Yer Datos Traneformar ánalicar Gráficos fildades Ampliaciones Ventana Ayuda 


ELIAS EA EAT 


Nombre Tipo Anchura | Decimales: Etiqueta Valores. Perdidos | Columnas — Alineación Medida — Rol] 
cien_nacido Numérico 8 1 Peso recien na... Ninguna Ninguna 8 Derecha 8 Escala Y Entrada 


¡Mi conacón 6 stección de ca coconan 


z AAA - 


O Perdido gel sistema 
O Perdido del sistema O Copiar valores antiguos 


0) Peraiao por el sistema o el usuario 
Antiguo —= Nuevo: 


14m 181 | 


Las variaples de salida son seres 


8 Rango 
hasta 


[ 


() Rango, LOWEST hasta el valor 


O Rango, valor hasta HIGHEST. 


O Tgo0s tos demás valores m 


¡BI SPSS Statsstcs Processor está listo "Unicode ON 


e 300 
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Valores Perdidos | Columnas — Almeación | Medida Rol 


Numénco. Ninguna 8 E Derecha $ Escala Entrada 
|. AE =] 

4 JJ] pvatoraniguo Valor nuevo. E 
5 | [ova 8 valor [7 

CH | O Persas del sistema. a 
1 Jl | oreramocnsistema O Coptar 

E] | O Poraido porel sistema o el yusuano 

2 M9 Rango 

2 Bs ] 

n 

a = Lanas) 
— | | O Rango. LOWEST hasta elvalor 

8 | 0 rango, vaornasta MoHEST 

a | Las vanagies de sanda son seres 

z 31 | 0 rgóos1os demás valores m 

a 

2 

E 

a 
E73S 

25 

E] 

E 

a 

57 

” 

n 

ES 

qE. El 

2— 

36 


IBM SPSS Statistics Processor está listo Unicode ON 


Cuando se termine de ingresar los rangos presionar, continuar y 


aceptar. 
Y se crea una variable Peso_recien_nacido_1. 


$9 *Sin tuto [CorguntoDatos0] - IBM SPSS Statistics Ecitor de datos = 0 2 
Arcmo Estar ver Dtos Irmstormar Analizar Gráscos  Limaades Ampéaciónes Ventana ApuOa 


2hA8 M4 E [al 


Tipo. Anchura Decimales Ebqueta /alores Perdidos  Colurmas Alineación Medida Rol 
1] Peso_recien_nacido Mumánco 8 1 Peso recien na — Ninguna Mmguna 8 E Derecha — P Escala Y Entrada 
2 Peso_recien_nacido1 Numérico 8 2 Peso recien na — Ninguna Mnguna 2 MA Derecha — ¿Nominal Y Entrada 
3 
4 
ñ 
G 
7 
Ó 
s 
E 
" 
e 
a 
“ 
A 
16 
-—E—. 
pa] 
== — 
E 


¡6M SPSS Staisnca Processor está listo Unicode ON 
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En la variable Peso_recien_nacido_1, presionar la opción valores e 
ingresar: 


pe Estar yor Datos Iranstmae gnalar Gráficos úiicades AmpSaciones Ventana ApuGa 


298E> HEHE 8 A 


Les 


Y Poner aceptar. 


En el Menú del SPSS escoger la opción ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS-FRECUENCIA-pasar la variable Peso_recien_nacido 


1 al casillero derecho-ACEPTAR, y nos muestra los resultados 


UG “Resunado [Documento] - BM SPSS Stata Viso 


o 
Arcrovo Estar Yee Qatos Iransfommar inseñar Fomglo Analuar Crfcos [dades Amplaciones Ventana Anda 


o mal 


2H823 2% Me; 


» Frecuencias 


Estadísticos 


e o 2 


Calculando la Media, La Mediana y E Moda 
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En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 

DESCPRITIVOS-FRECUENCIAS-pasar la variable 

Peso _recien_nacido1 a la casilla de la derecha-ESTADISTICOS- 

marcar media, mediana y moda-CONTINUAR-ACEPTAR 
ENTE ONE ROO 


a | 


| 


Útana>b 


jstanies 
17 14 Peso recien nado Peso_sacien_naod e Pesorecien nacido1 [Peso_yeven_naci. 


BM SPSS Statsts Processor está listo 


Estadísticos 


Peso recien nacido1 


N Válido 34 
Perdidos 0 
Media 4,2059 
Mediana 5,0000 
Moda 5,00 


Para el cálculo de la Media Geométrica, Media Armónica, con los 
mismos datos ya ingresados en el menú del SPSS escoger: 
ANALIZAR-INFORMES-RESUMENES DE CASOS- pasar la variable 
Peso_recien_nacido1 a la casilla de la derecha -ESTADISTICOS y 
seleccionar media armónica, media geométrica y pasar a la casilla de 
la derecha-CONTINUAR-ACEPTAR 
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a 
Archivo  Ectar Ver Datos Iramstormar Analizar Gráficos Uilidades Ampliaciones Ventana Ayuda 


23D ca AAA A AE ¿ola 


Poso_seci — dis Peso_secien_nacido! 
en_nacid var rr var var var var var vor var 


Visinle: 2 de 2 vaniables 


e 


Yanaoles (fans) 


4 Pesorecien nacido [Peso_recien_ | 8) Peso recen nacido ua 
$3 Informe de resumen: Estadisticos 
| 
| Estadisticos Estadísticos Oe casilla 
Media Hecia armónica 
Mediana Media geomética 


Jide did 


1 
2 
3 
4 
5 
5 
7 
5 | lHectana agrupaca 
> vatapios e aguoación | [bea, exoros mega 
| ¡Suma 
S [la hinimo 
J A [Mámmo 
1 Mostar casos [rango 
y > Primero 
1 |  WLimtarios casos alos primeros [100 Únimo 
15 | [WMastrarsólolos casos válidos Desmación estándar 
46 | [ó Mostrarios números de caso Pere 
mo] aa Cea) (Genis) Canet) (LA [oese noo caros 
1 e mo. o; Y jAsimeria 
1 32 500 Des. Error de asimetría 
Porcentaje dela suma lot 
5 E 5 pm a 
a 32 5,00 
2 32 5.00 
2 33 5,00 
a 33 5.00 
25 33 5,00 
26 34 5.00 
a 34 5,00 
2 35 5.00 
2 36 6,00 
30 36 5.00 
El] 37 6,00 
E 37 5.00 
a 39 7,00 
A” ESE 


_ [IBM SPSS Statistics Processor está listo | [Unicode:ON 


Resúmenes de casos 


Peso recien nacido! 
Media Media 
armónica geométrica 
3,2949 3,8083 


3.8. Ejercicios Propuestos 


1. Los siguientes datos corresponden a pesos ( Kg) de 20 
alumnos. 


50.5 545 524 545 550 615 61.0 60.0 62.0 58.5 
51.4 525 625 505 500 505 525 585 64.2 50.5 


a. Hallar e interprete la media aritmética, mediana y moda. 
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b. Si los pesos de los alumnos se incrementan en un 15 % 
mas % Kg. Hallar el nuevo peso promedio y el peso 
mediano. 

2. La siguiente tabla de distribución de frecuencias proporciona los 


montos por venta en cientos de nuevos soles de un grifo. 


Montos 
por 10-15 | 15-20 | 20-25 | 25-30 | 30-35 | 35-40 
Ventas 
f 12 15 20 25 12 8 
a. Hallar e interprete la media aritmética, mediana y moda. 
b. Si los montos por ventas se incrementan en 12%. Hallar el 


monto promedio y el monto mediano. 


3. La tabla de distribución de frecuencias tiene como variable en 
estudio las estaturas (mts) de 50 personas. 

Estatura 

(mis) | 4 h, E, ds de 
1.67-1.69 5 
1.69-1.71 9 
1.71-1.73 12 
1.73-1.75 10 
1.75-1.77 9 
1.77-1.79 5 
Total 50 


Calcular e interprete: E 
a. o Ahi Fs. hi H-qOm x 
3 5 2 3 a 


2 3 5 2 3 
b. La estatura media, mediana y modal de las personas. 
4. El promedio de 10 calificaciones del curso de estadística en un 


salón de clase es de 9.8; pero al ingresar los datos a la 
computadora en lugar de digitar 14 se digita 4, y en lugar de 
digitar 8 digita 12. Calcular la nueva nota promedio con estas 
correcciones. 


D. De la siguiente tabla de distribución de frecuencias Hallar la 
media aritmética, mediana, media geométrica y media armónica. 
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Montos ! 
por Í. h; F i H, XxX i 
ventas 
en 

18.5-23.5 5 

23.5-28.5 11 

28.5-33.5 20 

33.5-38.5 10 

38.5-43.5 4 

50 
6. Un centro de información realizó durante los últimos 4 años las 


siguientes adquisiciones de revistas científicas: 30, 25, 20, 15, si 
el presupuesto para la adquisición se ha mantenido durante los 4 
años. Hallar el promedio de revistas adquiridas por año. 


Y, La media aritmética de dos números es 10 y su media 
geométrica 8, Hallar su media armónica. 


8. La población de un país en el año 1990 fue de 23,5 millones de 
habitantes, en el año 1995 fue de 25.6 millones de habitantes y 
en el año 2000 de 27.9 millones de habitantes. Hallar la 
población media para esos tres años. 

9. Un centro de investigación ha experimentado un incrementado 
en la producción de revistas científicas tal como se detalla: 12% 
en el año 2000, 8% en el año 2001 y 14 % en 2002. Hallar el 
promedio de crecimiento anual. 


10. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio al número de hijos. 


número de 
hijos h h, F, 
1 0.1 
2 0.2 
3 28 
4 14 
5 7 
Total 
Calcular: 
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11. 


Los siguientes datos corresponden a edades (años) de alumnos 
de instrucción primaria. 
121412121314151214 14 


Hallar la media, mediana y moda de las edades de los 
alumnos. 


De la pregunta anterior, calcular la media, mediana y moda 
después de 5 años. 

Los datos de la tabla, tiene como variable en estudio la edad de 
estudiantes(años) 


Edad 
(años) Í h, F, H, de 
14 
0.4 0.56 18 
12 
8 
2 
Total 
a. Completar la tabla de distribución de frecuencias 
b. Hallar la media, mediana y moda de las edades de los 


estudiantes. 


La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio al número de hijos. 


númer 
Jer ode É h, F, H, 
1 0.1 
2 0.2 
3 0.4 
4 0.2 
5 0.1 
Total 


Hallar la media, mediana y moda de la variable número de hijos 
La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio a los montos por ventas registrados por una 
tienda comercial. 
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Montos por ! 
ventas ( S/) hi h, F, HB, ee 
4,500 - 6,000 0.15 
6,000 - 7,500 0.20 
7,500 - 9,000 0.45 
9,000 - 10,500 0.12 

10,500 - 12,000 0.08 
Total 


Hallar la media, mediana y moda de los montos por ventas. 


16. La tabla contiene datos de los tiempos(minutos) registrados en 
atender a los usuarios que concurren a un centro de información: 


X=Tiempo (minutos) 
Í h; F; H; X; 
0.5 - 1.0 0.10 
10-15 ta” 
15-20 0.35 
20 -25 “p” 
25 - 30 0.1 
Total 
a. Si la media aritmética es 1.75, completar la tabla. 
b. Hallar la moda y mediana del tiempo de atención a los 


usuarios que concurren al centro de información. 


17. El valor de la mediana para un conjunto par de datos es 20. Si 
los datos se incrementan en 20% más 4 unidades. Hallar el 
nuevo valor de la mediana. 


18. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio la edad (años) del jefe de familia. 


Edades (años 
Í h; F, H, X; 

24 - 28 5 
28 - 32 20 
32 - 36 10 
36 - 40 20 
40 - 44 5 

Total 60 


Hallar: la media, mediana, moda de las edades del jefe de familia. 


125 


EsTADÍSTICa DESCRiptiva y pROBABILIDAd pARa LAs CIENCIAS DE LA INFORMAción CON El USO DE] spss 


19. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio al número de artículos por revistas científicas. 


Número de 
artículos y h, F, H; 
15 12 
9 8 
10 15 
14 18 
18 7 
Total 60 


Hallar la media, mediana moda del número de artículos por 


revistas. 
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CAPÍTULO 4 
MEDIDAS DE VARIABILIDAD O DISPERSIÓN 


INTRODUCCIÓN 

En este CAPÍTULO se estudiarán las medidas estadística de 
variabilidad o dispersión para un conjunto de datos; si los datos fuesen 
iguales, se dice que no existe variabilidad o dispersión entre ellos, en 
caso contrario se dice que los datos presentan dispersión o 
variabilidad. El estudio de la variabilidad de un conjunto de datos es de 
suma importancia en todo análisis estadístico ya que de esto depende 
el grado de confiabilidad de las estadísticas que se calculan.. 


Las medidas de variabilidad o dispersión se clasifican en: 

. MEDIDAS DE VARIABILIDAD ABSOLUTAS 

Cuando su valor esta expresado en la misma unidad de medida de los 
datos originales. Las principales medidas de variabilidad absolutas son: 


1. Rango 
2. Variancia o Varianza 
3. Desviación estándar 


. MEDIDAS DE VARIABILIDAD RELATIVA 
Cuando su valor carece de unidad de medida; la medida de variabilidad 
relativa que se usará es: El Coeficiente de variación o variabilidad 


4.1. ELRANGO 
El rango es una medida (distancia), a través de la cual se 
distribuyen todos los datos de la muestra o población. Se calcula 
por la diferencia entre el dato mayor y dato menor que toma la 
variable. Un valor del rango diferente de cero nos indica la 
presencia de variabilidad de los datos, mas no nos indica acerca 
de la variabilidad interna entre los datos. 


Para datos sin agrupar: Rango = Dato mayor— Dato menor 
Para datos agrupados: Rango = LS ;¿— Ll; 

Donde: 

LSy = límite superior de la última clase 

LI, = límite inferior de la primera clase 
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Ejemplo: 
Sean los montos por ventas de una tienda comercial expresada en 
nuevos soles: 


1500 2300 1800 2000 1500 2400 
2300 1000 1200 2400 2500 1800 


De acuerdo con la definición el rango es: 
Rango = R = 2500-—1000= 1500 Soles 


Nos indica que 1500 nuevos soles es la distancia entre la venta menor 
y la mayor; el rango es una medida de dispersión de primera vista para 
la variabilidad de los datos; pero no evalúa el grado de variabilidad de 
los datos intermedios. 


NOTA: 


Si todos los datos fuesen iguales el rango es cero, nos indica que todos 
los datos se concentran en un mismo punto. Si el rango es diferente de 
cero nos indica que los datos no se concentran en un mismo punto; es 
decir existe variabilidad o dispersión de los datos 


El rango puede ser positivo, negativo o cero 

El rango posee unidad de medida, que es la misma de los datos 
originales. 

El rango es bien sensible a la presencia de datos extremos (datos muy 
altos o datos muy bajo de lo normal) 


4.2. LA VARIANCIA O VARIANZA 


Su valor corresponde al promedio de las desviaciones al cuadrado de 
los datos con respecto a la media aritmética. Es decir su valor da una 
idea del grado de variabilidad de los datos con respecto a la media 
aritmética. La variancia para un conjunto de datos esta expresada en 
unidades cuadráticas. Por ejemplo, si la unidad de medida de los datos 
es kilogramos, la variancia será expresada en kilogramos al cuadrado. 
Este hecho dificulta la interpretación de la variancia. 
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. CÁLCULO DE LA VARIANCIA PARA LA POBLACIÓN PARA 
DATOS SIN AGRUPAR Y DATOS AGRUPADOS 


Sea X una variable en estudio que toma los valores X1,X2,...,XN , Y 
H su media aritmética poblacional, la variancia poblacional se 


simboliza por O * y es definida por: 
PARA DATOS SIN AGRUPAR 
N 
Y, = y? y x2—- Nu 2 


0?=A — él 
A N N 
PARA DATOS AGRUPADOS 
k N 
de má: aye i—Nu? 
aia — El 
E N N 


. CÁLCULO DE LA VARIANCIA PARA UNA MUESTRA PARA 
DATOS SIN AGRUPAR Y AGRUPADOS 


PARA DATOS SIN AGRUPAR 
Sea X una variable en estudio que toma los valores X1,X2,... Xn, Y 


x su media aritmética muestral, la variancia para la muestra se 
simboliza por se y es definida por: 


Ya-x Ni-nxk 
2_ sl i — dl E — El n 
a n-1 n-1 _ n-1 


PARA DATOS AGRUPADOS: 
. 2 
k = k 2 k > 21) 
e Xx ha de CAE UnX NANA, Ely — 


S2= 4H — ¿l — El 
- n—1 n-—1 n-—1 
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NOTA-1 


Si los datos fuesen todos iguales la variancia es cero, esto nos indica 
que todos los datos están concentrados en la media aritmética, en 
otras palabras no existe variabilidad de los datos con respecto a la 
media aritmética. 

Si los datos son diferentes, de acuerdo a la definición el valor de la 
variancia será mayor que cero, en otras palabras existe variabilidad 
entre los datos con respecto a la media aritmética. 


NOTA-2 


Es riesgoso usar el valor de la variancia para concluir que los datos de 
la muestra son muy o poco variable. Su uso es más que todo para 
comparar la variabilidad entre dos o más conjuntos de datos que tienen 
media aritmética similares. 


Ejemplo-1 


Sea una muestra aleatoria de los pesos kg de 15 alumnos de un 
salón de clases, Hallar la variancia. 


35.5 37.5 38.0 38.0 39.0 37.0 36.8 35.8 36.0 35.0 35.0 
36.5 38.5 38.0 38.0 


De los datos, calculamos: 


15 


yx, = 554.6 


El 


15 
Y 1¡?=20528.88 
El 


15 p 2 
5 > ; 20528- 88- (554.6) 
2 y 35 Dl5 _ 
ce = =1.67638 
15-1 14 

S?=1.67638Kg ? 


1.67638 Kg ?, este valor nos indica la presencia de variabilidad de los 
pesos de los alumnos con respecto al peso promedio. 
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Ejemplo-2 

| Peso | f | hi (F, | H|X, 
1 [1.4 -1.8) 2 5.88% 2 5.88% 1.60 
2 [1.8 _ 2.2) 4 11.76% 6 17.64% 2.0 
3 [2.2 e 2.6) 4 11.76% 10 29.40% 2.4 
4 [2.6 3.0) 5 14.71% 15 44.11% 2.8 
5 [3.0 3. 4) 10 29.42% 25 73.53% 3.2 
6 [3.4 3.8) 7 20.59% 32 94.12% 3.6 
7 [3.8 w 4.2) 2 5.88% 34 100% 4.0 

TOTAL 34 100.0% 


Calcular el valor de la variancia 


n=34 


15 


2 PF; =308.48 


15 
Y x.f= 100 
El 


Nay La 308.48 (100) 
s2= 2 34 0,43522 
34-1 33 


0.43522 Kg?” , es el resultado del promedio de las desviaciones al 
cuadrado; este valor nos indica la presencia de variabilidad de los 
pesos de los recién nacidos con respecto a su peso promedio en 


Kg?. 
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. PROPIEDADES DE LA VARIANCIA 
1. Si los datos de la muestra son iguales; es decir los valores que 


toma los datos es constante; entones su variancia o variabilidad 
es igual a nula (cero); es decir: 


X= =..=X=..=xw=m>X=m>58?=0 


2. Cuando a todos los datos de la muestra, se le multiplica por una 
constante "a" y además se le suma o resta otra constante "b", 
entonces la variancia de los datos transformados, es igual a la 
primera constante al cuadrado multiplicado por la variancia de 
los datos originales. 


XX EOS, sea la transformación 


1 2 i n x 
y¡= axi+ b , luego se cumple que la variancia de los datos 
transformados es igual a: 
S 2_ as 2 
y x 


4.3. DESVIACIÓN ESTANDAR 


Su valor, se define como la raíz cuadrada positiva de la variancia; es 
decir, 


Sx = VVariancia 


El valor de la desviación estándar para un conjunto de datos esta 
expresado en las mismas unidades de la variable en estudio. Su valor 
es mayor o igual a cero, un valor cero indica que los datos de la 
muestra esta concentrados en un mismo punto ( no hay variabilidad o 
dispersión), un valor mayor a cero indica la presencia de variabilidad o 
dispersión de los datos con respecto a la media aritmética. 


Ejemplo: 
De los ejemplos anteriores se tiene: 


Para datos sin agrupar: 


Sy==/1.67638kg? = 1.29475Kg 
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Como la media aritmética de los datos es 36.97 kg., y la desviación 
estándar 1.29 kg. Valor que indica la presencia variabilidad o 
dispersión de los datos con respecto a la media aritmética. 


Para datos agrupados: 
S,= ,/0.43522kg? =0.65971Kg 
Interpretación 


1.29475 Kg, es la desviación promedio con respecto a la media 
aritmética. 

0.65971 Kg, es la desviación promedio 
aritmética. 

Ambos valores obtenidos nos indica la presencia de variabilidad de los 
datos con respecto a la media. 

NOTA-1 


con respecto a la media 


La desviación estándar al igual que la variancia, se utiliza para 
comparar la variabilidad o el grado de dispersión de dos o más 
conjunto de datos que poseen la misma unidad de medida y tienen sus 
promedios similares; es decir si se tiene dos a más conjunto de datos 
que poseen la misma unidad de medida y promedio similares, tendrá 
mayor dispersión o mayor variabilidad con respecto a la media 
aritmética aquel conjunto de datos que tiene la mayor variancia o 
desviación estándar. 

Ejemplo 


De la tabla que conjunto de datos son mas variables o están mas 
dispersos 


Muestras Datos Media Variancia Desviación 
Aritmética estándar 
1 4,5,6 5 1 1 
2 1,5,9 5 16 4 


Los datos de la muestra 2 están mas dispersos que la muestra 1 


4.4. COEFICIENTE DE VARIACIÓN 


Es una medida de variación relativa no tiene unidad de medida se 
calcula haciendo uso de la siguiente formula: 
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S 
CV="_ 100% 
X 


El valor de coeficiente de variación CV , indica el número de veces 
que la desviación estándar contiene a la media aritmética, cuando 
contiene más veces a la media indica que los datos son más variables. 
Su valor se usa para comparar la variabilidad o dispersión entre dos o 
más conjuntos de datos que poseen diferentes unidades de medidas y 
medias aritméticas diferentes. 


Sean A y B dos conjuntos de datos si el coeficiente de variación para el 
conjunto A es mayor al coeficiente de variación para B, entonces los 
datos de A presentan mayor variabilidad o dispersión relativa que los 
datos de B. 

Ejemplo-1 


Sean los siguientes datos: 


1, 2, 3, 4, 5 
Hallar e interprete el coeficiente de variación 

=> 

se=25 

S=1.5811 

1.5877 o bb 
CV= x100% = 52.70% (Nos indica que la desviación 
3 


estándar para este conjunto de datos representa el 52.70% de 
su media aritmética) 


Ejemplo-2 


La siguiente información corresponden a los montos (S/.) por ventas 
de dos tiendas comerciales A y B. 


Valores estadísticos Tienda Comercial A Tienda Comercial B 
Venta promedio 22,000 18,500 
Desviación estándar 2640 3145 


¿Qué montos por ventas están más dispersos? 
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Para la tienda Comercial A 


CV= 2 oo = 12.0% 


22000 


Para la tienda Comercial B 


3145_ 
CV= x100% = 17.0% 


18500 


Por lo tanto los montos por ventas de la tienda comercial B son más 
variables o más dispersos que los montos por ventas de A. 


Aplicando el SPSS para datos no agrupados Media, Rango, Varianza, 
Desviación estándar, 


Definiendo las variables 


UR Sin titulo! [ConjuntoDetos0) - IBM SPSS Stetestscs Editor de datos 
Archivo Editar Ver Datos Iranstomar Analizar Gráficos Líilidades Ampliaciones Ventana Ayuda 


3H8M e EhAR A AE ole 


| Nombre Tipo. Anchura | Decimales Etiqueta Valores Perdidos Columnas Alineación Medda Rol 


1 Peso_recie. Numénco 8 1 Peso recien na — Ninguna Ninguna 8 33 Derecha — H Escala » Entrada 


IBM SPSS Statistics Processor está listo 


| para buscar Y: "€ JOA BM or 


Unicade:ON 
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Ingresando los datos 


| IMA $PSS Seatistics Editor de datos - e 
Archivo Sita Yer Datos Iranstommsr Ansitar Gráficos LMicaces Ampliaciones Ventana Ayuda 


ECTS ELO ERRATA 


Peso_tect 


9 on necia | var or ar sor sor sor sor a = z — he, a = e 
mw [== 
= ES 
= E 
> ES 
- 5 
a 5 
= sE 
E + 
- 50 
z + 
= 5 
= Sa 
> SS 
EJ 3,7 
a 0 
z 


Calculando el Rango, la Varianza, la Desviación estándar, 


En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS--pasar la variable Peso_recien_nacido a la casilla de 
la derecha-OPCIONES- Desviación estandar; Varianza, Rango- 
CONTINUAR-ACEPTAR 


a 
Archivo Editar Yer Datos Transformar Analizar Gráficos  |Midaces Ampllaciónes Ventana Ayuda 


2548 M2 AAA As Ao le 


Pesofeci dis Peso_recian_nacido1 
¡4 em_nació 


Visible: 2 de 2 vanables 
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Estadísticos descriptivos 
Desv. 
N Rango Desviación Varianza 


Peso recien nacido 34 2,6 ¿6600 ,436 


N válido (por lista) 34 


Aplicando el SPSS para datos agrupados: Rango, Varianza, Desviación 
estándar, con datos ya ingresados; en el menú del SPSS escoger: 


Para datos agrupados 
Se elabora la tabla de frecuencias para datos agrupados: 


Te 


Cálculo del Rango” R*. 
R = peso mayor —peso menor. 


R =4.1-15=2.6 


Cálculo del número de clases (K). 
K=1+3.3Log(34) = 6.05388 


Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 


OBSERVACIÓN 

El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o igual a 5, entonces la cifra 
entera del número se incrementa en una unidad. 


Ejemplo: 
Si, K= 6.7, usando el redondeo simple K = 7; 
Si, K= 6.4, usando el redondeo simple K = 6; 


Cálculo del ancho del intervalo de clase (A) 


El ancho del intervalo de clase se obtiene a través de la siguiente 
fórmula: 


R 
A= 
K 
Para los datos se tiene: 


A= e E 0.43333 
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El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 


A =0.4 
E=AK-—R =0.4(6) — 2.6 = 0.2 
Como el error es negativo, se debe incrementar en una clase 
má 
2.6 


És 


A = 0.4 


E=AK-R=0.4(7) -2.6=0.2 


Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 


E 0.2 
valor de arranque= dato menor=  =1.5-  =14 


2 2 


En el menú del SPSS, escoger la opción TRANSFORMAR- 
RECODIFICAR EN DISTINTAS VARIABLES-pasar la variable peso- 
recién-nacido al casillero de la derecha, en la derecha en donde indica 
variable de salida Nombre: poner peso_recien_nacido1 y en la etiqueta: 
poner Peso _recien_nacidol — PRESIONAL LA OPCION CAMBIAR- 
VALORES ANTIGUOS Y NUEVOS-RANGO-poner desde 1,4 hasta 1,8, 
luego en VALOR poner 1 y AÑADIR, así sucesivamente continua con 
todos los rangos de 3,8 hasta 4,2. 


a 
Archivo  Ectar Yer Datos Iranstemmar naar 


Entada 
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El 
Archivo Eltar Ver Datos Iramsformar Analizar Gráficos Uillidades Amplaciones Ventana Ayuda 


ELIAS EA EP 


Tipo | Anchura Decimales: Etiqueta Valores | Perdidos |Colummas| Almeación | Medida Rol 


Peso_recien_nacido Numénco 8 1 Peso recien na Ninguna imguna 8 Derecha 4 Escala YN Entrada 
5 1 3 Recoóificar en variables diferentes: valores antiguo y nuevo . 
4 Jl vatoranguo Valor nuevo E 
2 ]||Oxaoc 8 var [7 
B 7 O Pero del sitema 7 
1] | O Peraioo del sistema O Cogsar valores antiguos 
3 O Percido por el sástema o el yzuano 
—2 | | rango A _— 
10 ha ] > 
— hasta 


O Rango, valor hasta MIGHEST: 


Las vanagles de salda son seres 


2 ] laz ] 
E 3 O Rango, LOWEST hasta sl valor 
1] | O Tacos tos demás valores m 1] 


y Lcontnvar) | cancela] ayuno) 


¡Bl SPSS Stabstics Processor está sto Unicode: ON 


Cuando se termine de ingresar los rangos presionar, continuar y 
aceptar. 
Y se crea una variable Peso_recien_nacido_1. 


$9 *Sin tulo! [CorguntoDatoz0] - IBM SPSS Statistics Editor de datos E E 
Arcnio Estar ver Datos Iramstormar Analizar Gráscos  LÚoades  Amplaciónes Ventana Ayo 


jalores | Perdidos Columnas] Alineación Medida Ral 
1 Peso_recien_nacida Muménco 8 1 Peso recien na — Ninguna Mmguna 8 E Derecha — $ Escala YN Entrada 
2 Peso recien_nacido! Numénco 8 2 Peso recien na — Hinguna —— Minguna 21 MM Derecha — di Momnal O Entrada 


Y 


eva leia 


| 


ele 


Bu SPSS Staistcs Processor está listo Unicode:ON 


e 30 .fonos o 
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En la variable Peso_recien_nacido_1, presionar la opción valores e 
ingresar: 
a 


Arcióvo Editar Yer Datos Transformar ánaizar Gráfcos ¡lidades Aemplaciones Ventana Ayuda 


AEREA EAS 


Y Poner aceptar. 

En el Menú del SPSS escoger la opción ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS-FRECUENCIA-para la variable Peso_recien_nacido 1 
al casillero derecho-ACEPTAR, y nos muestra los resultados 


*» Frecuencias 


Estadísticos 
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Calculando el Rango, la Varianza, la Desviación estándar 


En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS- -pasar la variable Peso_recien_nacido1 a la casilla 
de la derecha-OPCIONES-El Rango, La Varianza, la Desviación 
estándar-CONTINUAR-ACEPTAR 


a 
Archeeo Editar Ver Gatos Iransformar paliza Gráficos filidades Ampliaciones Ventana Ayuda 


= —--1 A 
35048 MN -a ARA A AE ¿ole 
a Viinla:2 de 2vanattes 
Peso_jeci — di Peso_recien_nacido1 A] 
$ en_nació TO | le 
: 23. 509 1 Descipivos Opcone : A o E 
3 25 3.00) ¡fuead Suma 
2 25 3.00 Dispersión 
z A 34 Y Desviación estándar "— Misimo 
a 27 4.00 MO Yaranes pm 
Y Bango Envor estándar meda 
“ 28 4.00 
5 29 4.00) y Caracienzar as 
1 3,0 4.00 
” 31 50 
LJ 31 5.00 SETE, a 
" = 200 8 ta e varo (a) 
> E 20% | oamaotrco 
> a 200) | O tieaas ascandenes 
22 32 5.00 O Megias aescendentes. 
2 33 5.00 
a 33 500 [Gommuar)(cancetar) (_Ayuoa 
25 33 5.007 
25 34 500 
2 34 500 
2 5 6.00 
2 35 600 
EJ 36 6,00 
» a so uercar valores estendontacos como veracies 
2 17 6.00 Losceptar Jl Begur astaclecar]_ Cancelar ) | Ayuda 
a 
E 


IBM SPSS Statistics Processor está sto Unicode: ON 


Estadísticos descriptivos 


Desv. 
IN Rango Desviación Varianza 
Peso recien nacido1 34 6,00 1,62889 2,653 


N válido (por lista) 34 
4.5. EJERCICIOS PROPUESTOS 


1. Los siguientes datos corresponden a estaturas (mts) de los 
alumnos de cierta universidad. 
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Hallar e interprete las medidas de dispersión absoluta y relativa 


2. Los siguientes datos, corresponden a una muestra al azar de 40 
frascos conteniendo mermelada de piña, los pesos (grs) se 
presentan a continuación: 


149 164 171 176 181 185 187 190 
156 165 172 176 182 186 187 194 
157 165 174 178 183 186 188 196 
158 168 175 180 183 188 188 198 
162 170 175 180 184 187 189 202 


a. Elaborar la tabla de distribución de frecuencias. 
b. Calcular las medidas de dispersión o variabilidad. 

3. Se eligen al azar a 70 trabajadores de una empresa, la 
distribución de los ingresos mensuales se presentan en la tabla 
siguiente. 

i Ingresos HE 
1 | [400 600) 6 
2 | [600 800) 12 
3 | [800 1000) 18 
4 | [1000 1200) 15 
5 [[1200 1400) La 
6 | [1400 1600) 7 
TOTAL 70 
Usando la información de la tabla, calcular: 
El Rango 
La variancia 


La desviación estándar. 
El coeficiente de variación 
la variancia y desviación estándar. 


DOT 
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f. 


La variancia y desviación estándar, si la empresa decide 
aumentar los ingresos de sus trabajadores en un 7% más 
45 nuevos soles. 


4. Una agencia bancaria, con la finalidad de reducir el tiempo en la 
atención a los clientes, elige una muestra aleatoria de 60 clientes 
en un día determinado y registra el tiempo (minutos) que demora 
en ser atendido, estos resultados se presentan en la tabla. 


i Tiempos hi 
1 [0.5 1.0) 0.1 
2 [1.0 1.5) a 
3 [1.52.0) 0.3 
4 [2.0 2.5) b 
5 [2.5 3.0) 0.15 
TOTAL 1 
a. Calcular el valor de “a” y “b” , si se sabe que el tiempo 


promedio de atención a un cliente es de 1.825. 


b. Calcular la desviación estándar. 
C. Calcular el coeficiente de variación. 
6. Los siguientes datos muestran los montos por ventas, en miles 


de dólares, de 20 vendedores de una compañía de computadora. 


40.2 29.3 35.6 88.2 429 26.9 28.7 99.8 35.6 37.8 
442 323 55.2 50.6 254 31.7 36.8 45.2 25.1 39.7 


a. 


Calcular la variancia, desviación estándar y coeficiente de 
variación. 


Si las ventas se incrementan en un 15% con respecto a 
los montos iniciales. Calcular el rango, la variancia, 
desviación estándar y coeficiente de variación. 


Elaborar la tabla de distribución de frecuencias. Calcular: 


rango, variancia, desviación estándar y coeficiente de 
variación. 
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Le Una muestra aleatoria de tamaño 20 tiene por media 5 y 
variancia igual a 0.36, sean las siguientes transformaciones: 


a. Si a cada dato se le incrementa en un 20% de su valor 
más 0.5 unidades. 

b. Si a cada dato se le incrementa en 25% de su valor más 
0.2 unidades. 


¿Que conjunto de los nuevos datos presenta la mayor variación? 


Ejercicios adicionales 


1. Sea la Tabla de datos: 
l X Ye Zz 
1 2 1 1 
2 1 1 1 
3 1 2 3 
4 3 2 1 
5 1 2 1 


Hallar el valor de: 
5 
a E + yO + zii + zi) 


LES HF 2H AZ AY z Y 
1 2 3 ii ii 


dd ii 


b. ¿Sl 
2. Sea la tabla de datos 

; xs f: 
1 10 2 
2 11 4 
3 12 6 
4 13 4 
5 14 2 

TOTAL 18 


Hallar el valor de: 


o 0 f | siendo 2h 


i=1 
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3. 


Una muestra tomada al azar de 100 estudiantes que concurren a 
la Biblioteca Central de la Universidad Nacional Mayor de San 
Marcos, arroja que: el 70% son varones; la edad promedio es de 
28.4 años; el 15% pertenecen a la Escuela Académico 
Profesional de Bibliotecología; el 70% opinan que los servicios 
que presta la biblioteca es bueno; el gasto promedio mensual es 
de S/.450.00. Con la información, establecer la población en 
estudio, la unidad elemental, tamaño de la muestra, variables, 
tipos de variables, parámetros y valores estadísticos. 


Una muestra aleatoria de 84 datos, arroja que el dato menor es 
17.1 y el dato mayor 37.2. Determinar los intervalos de clases 
para la tabla de distribución de frecuencias. 


Sea la tabla de distribución de frecuencias 


Edades(años) f hi F H; Xx Ñ 
[ 20 > 4 18 
[ > 12 
[ > 28 
[ > 36 
[ > 40 

Total 


Completar la tabla 


Sea la tabla de distribución de frecuencias, cuya variable en 
estudios es la edad (años) de usuarios, que concurren a un 
centro de información. 


Edades(años) f hi F; H; xXx 


20 24 > 4 


24 28 > 6 


28 32> 15 


32 36 > 15 


36 40> 6 


40 44 > 4 


Total 50 
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Calcular e interpretar h; , HA; => HA, 

¿Qué cantidad de usuarios tienen edades superior a los 26 
años?. 

¿Que % de usuarios tienen edades entre los 26 y 38 años. 


Una encuesta realizada a 20 jefes de hogar arroja los siguientes 
datos. 


1 3 2 4 2 0 1 2 
3 3 2 0 1 1 2 4 
2 2 1 2 


Elaborar la tabla de distribución de frecuencias y GRÁFICO 
respectivo. 
Una muestra aleatoria de 90 datos, arroja que el dato menor es 
20.45 y el dato mayor 70.35. Determinar los intervalos de clases 
para la tabla de distribución de frecuencias. 


Sea la tabla de distribución de frecuencias 


Edades(años) f hi F H; x 


[7 5 0.1 10 
OS 

[ > 0.4 

[ > 0.2 

[ > 4 


Total 


Completar la tabla 


Sea la tabla de distribución de frecuencias, cuya variable en 
estudios es la edad (años) de usuarios, que concurren a un 
centro de información. 


Edades(años) f hi Fi H; 2 
[20 24 > 4 
[24 28 > 6 
[28 32 > 15 
[32 36 > 15 
[36 40 > 6 
[40 44 > 4, 
Total 50 
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15. 


Calcular e interpretar hs , Hs > A, 

¿Qué cantidad de usuarios tienen edades inferiores a los 30 
años?. 

¿Que % de usuarios tienen edades entre los 22 y 42 años. 


Una encuesta realizada a 20 jefes de hogar arroja los siguientes 
datos. 


1 3 2 4 2 0 1 2 
3 3 2 0 3 1 2 4 
2 2 1 2 


Elaborar la tabla de distribución de frecuencias y GRÁFICO 
respectivo. 


La media aritmética de 20 datos es 4.5, si a cada dato se 
incrementa en su 20% más 3 unidades. Calcular su nueva media 
aritmética. 


El peso menor y mayor de 80 datos son 58.2 kg y 83.2 kg 
respectivamente: Determinar las clases para la tabla de 
distribución de frecuencias. 


Los siguientes datos corresponden a una encuesta tomada a 30 
jefes de familias, en la cual la variable en estudios es el número 
de hijos por familia. 


5 3 3 4 3 3 2 2 3 4 
4 3 3 4 4 3 3 3 3 5 
Calcular la media aritmética del número de hijos por familia. 


Distribución de las edades (años) de estudiantes de la UNMSM: 


Edades f h; F H; E 
18-22 10 
22-26 0.1875 
26-30 30 
30-34 15 
34-38 0.1250 
TOTAL 
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18. 


a. 
b. 
C. 


Completar la tabla de distribución de frecuencias 
Que % de estudiantes tienen edades entre los 20 y 32 años. 
Calcular la media aritmética de las edades. 


La media aritmética de 20 datos es 4.5, si a cada dato se 
incrementa en su 20% más 3 unidades. Calcular su nueva media 
aritmética. 


Los siguientes datos corresponden a una encuesta tomada a 30 


jefes de familias, en la cual la variable en estudios es el número 
de hijos por familia. 


Calcular la media aritmética, la mediana y la moda del número 
de hijos. 


Distribución de las edades (años) de estudiantes de la UNMSM: 


Edades f hi F; H; E 
18 - 22 0.1250 
22-26 0.1875 
26 - 30 0.3750 
30 - 34 0.1875 
34 - 38 0.1250 
TOTAL 1.0000 


Calcular la media aritmética, la mediana y moda de las edades 
de los estudiantes. 


Un estudiante del curso de estadística, calcula la media 
aritmética de 20 datos obteniendo como resultado 50; otro 
estudiante con los mismos datos obtiene por media aritmética 
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48, si el primer estudiante se equivoco al ingresar a la 
calculadora solo el último dato. Además la suma del dato errado 
y su verdadero es 100. Calcular el valor del dato verdadero. 


20. La mediana de un conjunto de datos par es 35, si cada dato se 
incrementa en 15% más tres unidades, hallar el valor de la nueva 
mediana. 


21. Los siguientes datos corresponden al número de artículos de una 
muestra elegidas al azar de 30 revistas científicas. 


12 14 11 12 13 12 11 12 12 14 
15 13 13 14 13 13 12 12 13 14 
14 13 13 14 14 13 13 13 13 15 


Calcular la media aritmética, mediana y moda del número de 
artículos por revistas. 


22. Distribución de las edades (años) de estudiantes de la UNMSM: 


Edades(años) Fi h; F i H i X; 
18 - 22 0.10 
22-26 0.45 
26 - 30 0.30 
30 - 34 0.11 
34 - 38 0.04 
TOTAL 1.00 


a. Calcular la media aritmética, mediana y moda de las edades de 
los estudiantes. 

b. Calcular el 4to. decil y 3er. cuartil. 

c. Que edades encierran al 70% central de los estudiantes. 
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23. 


24. 


Distribución de las edades de estudiantes: 


Edad(años) f hi F; H; Xx; 
16-20 0.05 
20-24 0.25 
24-28 0.40 
28-32 0.25 
32-36 0.05 
TOTAL 1.00 


Calcular para los montos por ventas: 


Media aritmética 

Mediana 

Moda 

El tercer decil 

El primer cuartil 

El 82 avo percentil 

Calcular la curtosis, interpretación 


O 7DODoOTp 


Los siguientes datos corresponden a una encuesta tomada a 30 
jefes de familias, en la cual la variable en estudios es el número 
de periódicos comprados durante una semana determinada. 


Elaborar la tabla de distribución de frecuencias y su GRÁFICO 
correspondiente para la variable en estudio. 
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25. Distribución de las edades (años) de estudiantes de la UNMSM: 


Edades f h, F, H, x, 
10 22 
0.1875 25 26 
0.6875 
15 
TOTAL 80 


a. Completar la tabla de distribución de frecuencias 
b. Calcular e interpretar: J > Fs HH, 
c. Que % de estudiantes tienen edades inferiores a los 30 años. 


26.  Latabla contiene datos sobre la edad de usuarios que concurren 
a un centro de información: 


Edad (años) f h, F, H, Xx, 
18-22 0.10 
22-26 “a” 
26-30 0.35 
30-34 “bp” 
34-38 0.1 
Total 


Si la media aritmética es 28.2 años. 
Calcular, la mediana, la moda, el 4to decil, el tercer cuartil 
y el 82 percentil. 


27. La variancia de un conjunto de datos no agrupados es 20, si 


cada dato se incrementa en un 10%. Hallar el nuevo valor de la 
variancia. 
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28. 


29. 


30. 


31. 


La estatura menor y mayor de 60 personas son 1.62 metros y 
1.82 metros, determinar para la tabla de distribución de 
frecuencias. 


La tabla contiene datos sobre la edad de usuarios que concurren 
aun centro de información: 
Edad (años) h, F, H, x, 

20-24 0.10 

24-28 ta 

28-32 0.30 

32-36 “p” 

36-40 0.1 

Total 


Si la media aritmética es 30 años. 
Calcular, la mediana, la moda, el 6to decil, el primer cuartil 
y el 82 percentil de las edades. 


10 


La media aritmética y variancia de 4 datos es 6 y 3 . 
respectivamente, una revisión de los datos, se encontró que en 
lugar de ingresar a la calculadora el valor 8 se ingreso por error 
el valor 4. Con esta información, calcular la media aritmética y 
variancia corregidas. 


La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio el número de artículos de 80 revistas 
científicas sobre biología elegidas al azar. 


X=N9 Í 
porrovistas | Li | A | Fl | Ho | x, 

21 5 

17 5 

19 20 

18 40 

20 10 

Total 80 
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Hallar: la media, mediana, moda, la variancia y el coeficiente de 
variación. 


32.  Deuna muestra de 80 datos el mayor y menor son 56.25 y 
12.34. respectivamente. Determinar los intervalos de clases para 
la tabla de distribución de frecuencias. 


33. La media de 20 datos es 5; la media de 30 datos es 6: Hallar la 
media de los 50 datos. 2 
(x,+ x)?= 1000 


34. Sean 50 datos, tal que X= 2, además 
El 
Hallar su coeficiente de variación. 


35.  Latabla contiene datos sobre la edad de usuarios que concurren 
a un centro de información: 


Edad (años) 
Í. h, F, H, Xx; 
0.10 22 
12 26 
0.20 
0.50 
4 
Total 
a. Completar la tabla 
b. Hallar la media aritmética, mediana y moda 
C. Que porcentajes de usuarios tienen edades entre 22 y los 
30 años. 
d. Hallar la variancia y el coeficiente de variabilidad. 


36. La media aritmética de 20 datos es 5; la media aritmética de 30 


datos es 6: Hallar la media aritmética de los 50 datos. 
x=849 


37. Sean 50 datos, tal que x=4 además '= . Hallar su 
coeficiente de variación. 
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38. La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de información: 


Edad (años) 
$ h; F, (H, Xi; 
0.10 22 
12 26 
0.20 
0.50 
4 
Total 
a. Completar la tabla. 
b. Hallar la media aritmética, mediana y moda. 
G: Hallar la variancia y el coeficiente de variabilidad. 
d. Hallar el coeficiente de asimétrica. Interpretar resultado 


39. La media aritmética de 20 datos es 5; la media aritmética de 30 
datos es 6. Hallar la media aritmética de los 50 datos. 


40. La mediana de 60 datos es 18. Si a cada dato se incrementa en 
un 12% más 3 unidades. Hallar el nuevo valor de la mediana. 


41. Una muestra tomada al azar de 50 revistas científicas en 
biología, proporciona los siguientes datos con respecto al 
número de artículos por revistas. 


19 19 
Calcular: 
a. La media aritmética, la mediana, la moda del número de 
artículos por revistas. 
b. El tercer decil, el tercer cuartil y el ochenta y cinco avo 


percentil del número de artículos por revistas. 


154 


EsTADÍSTICa DESCRiptiva y prOBABILIDAd pARa LAs CIENCIAS DE LA INFORMAción CON El USO DE] spss 


42. 


43. 


44. 


La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de información: 


Edad (años) De h, F, H, x, 

20-24 0.10 
24-28 0.20 
28-32 0.46 
32-36 0.16 
36-40 0.08 
Total 1.00 

a. Hallar la media aritmética, mediana y moda de las edades 

de los usuarios. 
b. Hallar la media aritmética de las edades de los usuarios 3 


años después. 


El menor de los pesos de 70 estudiantes de la UNMSM es 56.4 
kg y el peso mayor es de 94.3 kg. Determinar las clases, para la 
tabla de distribución de frecuencias. 


Una muestra tomada al azar de 50 revistas científicas en 
biología, proporciona los siguientes datos con respecto al 
número de artículos por revistas. 

12 12 12 12 12 13 13 13 

13 13 13 13 13 13 13 14 

14 14 14 14 14 14 14 14 

14 14 14 14 14 14 14 14 

14 14 14 15 15 15 15 15 

15 15 15 15 15 16 16 16 

16 16 


Calcular: 

La media aritmética, la mediana, la moda, el cuarto decil, el 
primer cuartil y el setenta y dos avo percentil del número de 
artículos por revistas. 
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45. 


46. 


47. 


La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de información: 
Edad (años) 
$ h; F, H, Xi; 
0.10 22 
20 
0.46 30 
16 
0.08 
Total 1.00 
a. Completar la tabla de distribución de frecuencias. 
b. Hallar la media aritmética, mediana y moda de las edades 
de los usuarios. 
C. ¿Qué porcentaje de usuarios tienen edades entre los 26 y 
34 años. 
E) 
ú 2 
Qi .fi 
d. De la tabla calcular el valor de LAO 
n-1 
El menor de los pesos de 70 estudiantes de la UNMSM es 57.4 
kg y el peso mayor es de 93.3 kg. Determinar las clases, para la 
tabla de distribución de frecuencias. 
Una muestra tomada al azar de 50 revistas científicas en 


biología, proporciona los siguientes datos con respecto al 
número de artículos por revistas. 


Calcular: 

La media aritmética, la mediana, la moda, el cuarto decil, el 
primer cuartil y el setenta y dos avo percentil del número de 
artículos por revistas. 
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48.  Latabla contiene datos sobre las edades de usuarios que 
concurren a un centro de información: 


Edad (años) 
Í h; F, H, X, 
[ 22 > 0.10 20 
[ > 0.30 
[ AL 
[ > 0.04 
Total 1.00 
a. Completar la tabla de distribución de frecuencias. 
b. Hallar la media aritmética, mediana y moda de las edades 
de los usuarios. 
Cc; ¿Qué porcentaje de usuarios tienen edades entre los 24 y 
32 años. 
a ! o 
(xix).fi 
d. De la tabla calcular el valorde ata dE 
n-1 


49.  Latabla contiene datos sobre las edades de usuarios que 
concurren a un centro de información: 


Edad (años) f h, F, H, x, 
18 - 22 0.06 
22 - 26 0.50 
26 - 30 0.20 
30 - 34 0.12 
34 - 38 0.08 
38 - 42 0.04 
TOTAL 1.00 


Hallar: Di, Oz, Pss 


157 


EsTADÍSTICa DESCRiptiva y pPROBABILIDAd pARa LAs CIENCIAS DE LA INFORMAción CON El USO DE] spss 


50.  Latabla contiene datos sobre las edades de usuarios que 
concurren a un centro de información: 


Edad (años) f h, F, H, x, 
20 - 24 2 
24 - 28 27 
28 - 32 13 
32 - 36 6 
36 - 40 2 
TOTAL 
Hallar: R,5*% 5, CV,D,0O,P 
2 3 nn 


51. De dos bases de datos, se eligen en forma aleatoria 5 revistas 
científica, la variable en estudios es el número de artículos por 
revistas; los datos son: 

A=17,2,13,3,4$ ,. B=11112,11,13,11 $, 
¿Cual presenta mayor variabilidad? 


52. La variancia de 10 datos es 5, si a cada dato se le incrementa en 


un 20% más 2 unidades. Hallar el nuevo valor de la variancia. 


53.  Latabla contiene datos sobre las edades de usuarios que 
concurren a un centro de información: 


Edad (años) Di h, F, H, x, 
18 - 22 0.06 
22- 26 0.52 
26 - 30 0.20 
30 - 34 0.10 
34 - 38 0.08 
38 - 42 0.04 
TOTAL 1.00 


Hallar: Da, Qi Py 
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54.  Latabla contiene datos sobre las edades de usuarios que 
concurren a un centro de información: 


Edad (años) E h, F, H, x, 
20 - 24 2 
24 - 28 6 
28 - 32 13 
32 - 36 28 
36 - 40 1 
TOTAL 50 


Hallar: R, 57,5, CV,D,O,P 
3 1 78 


55. De dos bases de datos, se eligen en forma aleatoria 5 revistas 
científica, la variable en estudios es el número de artículos por 
revistas; los datos son: 


A=411,12,11,13,11) , B=47,2,13,3,4], 
¿Cual presenta mayor variabilidad? 


56. La variancia de 10 datos es 5, si a cada dato se le incrementa en 
un 30% más 4 unidades. Hallar el nuevo valor de la variancia. 
(4PTOS) 


57.  Seala tabla de datos: X=grado de instrucción del eje de familia; 
Y= número de hijos 


X | Sup | prim | prim | sec | sec | sup | sec | prim | Sup | sup 
Y (1 3 2 2 3 2 1 1 1 3 


Elaborar la tabla de doble entrada 


58. La media aritmética y variancia de 4 datos es 6 y y 
respectivamente, una revisión de los datos, se encontró que en 
lugar de ingresar a la calculadora el valor 8 se ingreso por error 
el valor 4. Con esta información, calcular la media aritmética y 
variancia corregidas. 
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59. Una muestra tomada al azar de 50 revistas científicas en 
biología, proporciona los siguientes datos con respecto al 
número de artículos por revistas. 

12 12 12 13 13 13 13 13 
13 13 13 13 13 13 13 14 
14 14 14 14 14 14 14 14 
14 14 14 14 14 14 14 14 
14 14 14 15 15 15 15 15 
15 15 15 15 15 15 15 16 
16 16 


Calcular: 

La media aritmética, la mediana, la moda, el cuarto decil, el 
primer cuartil y el setenta y dos avo percentil del número de 
artículos por revistas. 


60.  Latabla contiene datos sobre la edad de usuarios que concurren 
a un centro de información: 


Edad ! 
(años) Í h, F; H, de 
18-22 0.10 

22-26 ta” 

26-30 0.35 

30-34 “p” 

34-38 0.1 

Total 


Si la media aritmética es 28.2 años. 
Calcular, la mediana, la moda, el 3er. decil, el 1er cuartil y 
el 87 avo percentil. 


61. La siguiente tabla de distribución de frecuencias, tiene con 


variable en estudio el número de artículos de 60 revistas 
científicas sobre biología elegidas al azar. 
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temas e A Aa 
21 5 

17 5 

19 30 

18 10 

20 10 

Total 60 


Hallar: la media, mediana, moda, el 3er. decil, el 1er cuartil 
y el 87 avo percentil y el coeficiente de variación. 


62.  Deuna muestra de 80 datos el mayor y menor son 56.26 y 
12.38. respectivamente. Determinar los intervalos de clases para 
la tabla de distribución de frecuencias. 

63. Sean los datos: 

12 12 13 14 15 13 16 17 
15 18 19 17 
Hallar: la media, mediana, moda, el 3er. decil, el 1er cuartil y el 
87 avo percentil y el coeficiente de variación. -?= 147 
64. Sean 50 datos, tal que  1=2 , además 
El 
Hallar su coeficiente de variación. 
65. La tabla contiene datos sobre la edad de usuarios que concurren 
a un centro de información: 
Edad (años) 

Í: h, F, HA, X; 
0.10 22 

12 26 
0.20 
0.50 

4 

Total 
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66. 


67. 


a. Completar la tabla 
b. Hallar la media aritmética, mediana y moda 


C. Que porcentajes de usuarios tienen edades entre 22 y los 
30 años 


d. Hallar la variancia y el coeficiente de variabilidad. 
Sean los conjuntos de datos: 
A=14,12,8,7,10,8$ 

B=13,13,9,8,10,11% 


Indicar que conjunto de datos presenta mayor variabilidad o 
dispersión. 


La tabla contiene datos sobre la edad de usuarios que concurren 
a un centro de información: 


Edad (años) f h. F. H $ 


Í i i i 


20-24 0.10 


24-28 ta” 


28-32 0.30 


32-36 p” 


36-40 0.10 


Total 


68. 


Si la media aritmética es 30 años. 
Calcular, la mediana, la moda, el 3er decil, el 1er cuartil y 
el 85 avo percentil de las edades. 


10 


La media aritmética y variancia de 4 datos es 6 y 3 ; 
respectivamente, una revisión de los datos, se encontró que en 
lugar de ingresar a la calculadora el valor 8 se ingreso por error 
el valor 4. Con esta información, calcular la media aritmética y 
variancia corregidas. 
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69. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio el número de artículos de 80 revistas 
científicas sobre biología elegidas al azar. 


X=N? de artículos 
por revistas $ h, F i H i X j 
21 5 
17 5 
19 20 
18 40 
20 10 
Total 80 
Hallar: la media, mediana, moda, la variancia y el coeficiente de 
variación. 
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CAPÍTULO 5 
ANÁLISIS EXPLORATORIO DE DATOS 


INTRODUCCIÓN 


Esta técnica trata de la descripción de las características de la variable 
en estudio a través de sus datos, con el objetivo de conocer la 
dispersión, simetría o asimetría, ubicación de la mediana, así como la 
presencia de datos discordante (autlier). Para su análisis se presenta el 
diagrama de tallos y hojas, y el diagrama de cajas. 


5.1. GRÁFICO DE TALLOS Y HOJAS 


Esta técnica de análisis de datos, tiene el mismo propósito del 
histograma de frecuencias. Sin embargo una ventaja sobre el 
histograma es que conserva los datos en su forma original, ya que en la 
construcción del histograma de frecuencias, los datos originales ya no 
son considerados sino solo las frecuencias absolutas en las clases 
respectivas. Esta técnica de tallos y hojas proporciona información 
respecto: a la Simetría o Asimetría de un conjunto de datos, su 
dispersión o concentración y la presencia O ausencia de datos 
extremos o anormales (datos muy bajos o muy altos de lo común). 


5.2. CONSTRUCCIÓN DEL GRÁFICO DE TALLOS Y HOJAS 


Los datos de la muestra se ordenan en forma ascendente, luego un 
dato se divide en dos partes, tallos y hojas; los primeros dígitos del dato 
como un tallo y el último digito como una hoja de dicho tallo, las hojas 
pueden tomar valores entre O y 9. Luego los valores del tallos se 
colocan de menor a mayor en forma vertical y sus valores 
correspondientes a las hojas, separados por un segmento de recta 
vertical, y en la parte inferior del GRÁFICO de tallos y hojas se coloca 
la unidad que utiliza la hoja 


Ejemplos: descomponer los datos que a continuación se indica en tallo 
y hojas y colocar la unidad de la hoja: 


42 > 4 / 2 (El tallo es 4, de las decenas y la hoja 2 de la unidad) 
4.2 > 4/ 5(El tallo es 4 de la unidad y la hoja 2 de la décima) 
42.5 > 42/ 5 (El tallo es 42 de la unidad y la hoja 5 de la décima) 
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42.35 > 423/5 (El tallo es 423 de la décima y la hoja 5 de la 
centésima) 

0.42 > 4/2 (El tallo es 4 de la décima y la hoja es 2 de la 
centésima) 

0.042> 4/ 2 (El tallo es 4 de la centésima y la hoja es 2 de la 
milésima) 

0.0042> 4/2 (El tallo es 4 de la milésima y la hoja es 2 de la diez 
milésima) 


Ejemplo: Sean los datos de pesos de recién nacidos (kg) 


1.5 1.6 1.9 2.0 2.1 2.1 23 2.4 
25 2.5 2.6 2.7 2.8 2.9 3.0 3.1 
3.1 3.2 3.2 3.2 3.2 3.3 3.3 3.3 
3.4 3.4 3.5 3.6 3.6 3.7 3.7 3.9 
4.1 4.1 


Elaborar el diagrama de tallos y hojas, comentarios 


1 569 

2 01134556789 

3 011222233344566779 
4 11 


Siendo la unidad de hoja=0.1 (decima), el tallo es la unidad 


Interpretación de gráfico de tallos y hoja 


En este caso la distribución de los datos es asimétrica a la izquierda o 
asimetría negativa existe poca variabilidad y no hay datos extremos. 


En este caso los tallos lo conforman los primeros dígitos y las hojas 
los últimos dígitos. El uso del GRÁFICO de tallos y hojas es igual al del 
histograma de frecuencias, la única diferencia esta en que del 
GRÁFICO de tallos y hojas se pueden recuperar los datos, lo cual se 
logra al juntar los tallos con su respectiva hoja y multiplicándolo por la 
unidad de la hoja. 


5.3. DIAGRAMA DE CAJA 


El diagrama de caja al igual que el histograma de frecuencias y el 
gráfico de tallos y hojas, permite tener una idea visual de la distribución 
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de los datos; es decir, si hay simetría, ver el grado de variabilidad 
existente y por ultimo identificar la presencia de datos extremos (datos 
anormales). El diagrama de de caja es útil para comparar grupos de 
datos, es una alternativa Gráfica a la prueba de t-Student ( si se 
compara dos grupos de datos) o a la prueba de F-Snedecor del análisis 
de variancia, si se compara mas de dos grupos de datos, lo anterior es 
posible debido a que se pueden hacer múltiples diagramas de cajas en 
una misma Gráfica, en cambio los diagramas de tallos y hojas salen en 
secuencia uno por paginas, esto es usando los paquetes estadísticos 
MINITAB o SPSS. 


Características de diagrama de caja 


ql  q2=me q3 

1. La línea central de la caja representa el valor de la mediana 
(q2=me) 

2. Los lados de la caja representa el 1er. Cuartel (q1) y tercer 
cuartel (q3). 

3. Si el valor de la mediana se encuentra en el centro, entonces los 
datos se distribuyen simétricamente. 

4, Si el valor de la mediana tiende a q1, existe asimétrica hacia la 


derecha (asimetría positiva), si el valor de la mediana tiende a 
q3, existe asimétrica hacia la izquierda ( asimetría negativa) 


D. Si la caja no es alargada, nos indica que no hay mucha 
variabilidad en los datos. 
6. Si no hay datos extremos o anormales (datos muy altos o datos 


muy bajos de lo normal) , las líneas laterales de la caja llegan 
hasta el dato menor y el dato mayor. 

ye Si hay datos extremos estos aparecen identificados en el gráfico 
y las líneas laterales llegan hasta los valores adyacentes a las 
fronteras interiores. 

8. Las fronteras interiores se calculan por 
O1-—1.5RIO y 01 +1.5RIO , respectivamente, siendo 
RIO = 03- 01 el rango intercuartilico, las fronteras exteriores 


se calcula por O1— 3RIO y 01 +3RIO . 
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9. Si un dato cae fuera de  Qi¡-3RIQO y Q¡+BRIO , se dice 
que es un dato extremo, en caso contrario es un dato extremo 


moderado. Un dato extremo se representa por "0" y un dato 


moderado por ad 


Ejemplos 


Sean los datos de tres variables 


Xx Y Z 
1 12 11 10 
2 13 20 11 
3 20 21 20 
4 20 30 20 
5 20 30 21 
6 20 31 30 
7 21 40 30 
8 21 40 31 
9 30 41 31 


Representar los datos de las columnas en gráficos de tallos y hojas 
Para la primera variable 

21123 

(6) | 2000011 

7 |30011 

3 |401 

1/50 


Unidad de hoja=0.1 
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Para la Segunda columna: 


1111 
3|201 

6 |3 001 

(7)| 4 0011222 
4 |5 0011 


Unidad de hoja =0.1 


Para la tercera columna: 


2|1 01 

5 |2 001 

(6)| 3 001112 
5 |4 001 

2 |5 01 


Unidad de hoja=0.1 


Calcular de la media, mediana, desviación estándar para las tres 
columnas, usando las formulas ya conocidas: 


Columnas | Numero de media mediana | Desviación 
datos estandar 
1 15 2.667 2.1 1.079 
2 17 3.724 41 1175 
3 16 3.056 3.1 1.213 


5.4. OTRAS MEDIDAS DE POSICIÓN 


. PERCENTILES PARA DATOS SIN AGRUPAR 


Son valores que divide al conjunto de datos ordenados ascendente o 
descendente en 100 partes iguales, la formula para calcular los 
percentiles es: 


P¡=X ¡ =X +a( XX) (a) 


(n+ 1D 
100 


J=1,2,3,4,....99 
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Siendo: 


P;,= Valor que divide a un conjunto de “n” datos ordenados, de tal 
forma que el ¡% de los datos son menores o iguales que el valor del 


percentil P; y (100 — )% de los datos son mayores al valor de 
percentil P; 


Xi = Valor del dato en la posición del entero del número (+ y 
100 


“a” =decimal del numero ,, ,1) ¿_ 
100 


. CUARTILES - / PARA DATOS SIN AGRUPAR 


Son valores que divide al conjunto de datos ordenados ascendente o 
descendente en 4 partes iguales, en la formula es: 


ga 


(D) 


1+1) 


¡=X ¡+ al X,,— X;) J=1, 2,3 
4 


. DECILES PARA DATOS SIN AGRUPAR 


Son valores que divide al conjunto de datos ordenados ascendente o 
descendente en 10 partes iguales, en la formula ( OL »] toma los 
siguientes valores: 


a (n+1) J= X + al Xi A X;) J = l, 2, 3,4,5,6,7,8,9 
10 


Ejemplo: 

La variable peso (kg) de los recién nacidos 
1 569 
2 01134556789 
3 011222233344566779 
4 11 


Siendo la unidad de hoja=0.1 n=34 
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Calcular: 


Los cuartiles, el tercer decil y el percentil 72 avo, el rango 
intercuartilico, media, moda, desviación estandar 


Utilizado las formula correspondiente, se tiene: 

O1=X 02535 =X 875 = xg + 0.75(x0 — xg ) = 2.4 + 0.75Q.5 — 2,4) = 2,475 
02=X oso*s =X17.5 =X17 + 0.518 — x17) = 3.14 0.5(3.2 — 3.1) = 3.150 
Os=X o75s=X 2675= X26 + 0.2577 — X26 ) = 3.4 + 0.25(3.5 — 3,4 =3.425 


Tercer cuartil 
D,= X 0.3%35 — Xos= Xip+ 0.51: —=: e) = 2.5 + 0.5.6 > 2.5) NN 2.55 


Setenta y dos percentil 

Pn=X07:35=X 252=x25+ 0.2(126-— x25 ) = 3.4 + 0.2(3.4 — 3.4) = 3.4 
RIO = 0,- 0,= 3.425- 2.475 = 0,95 

x= 2.965 kg 


mo=3.2 kg 


s=0.687 kg 


0.687 
cv= 


*100% =23.17% 
2.965 


, P. 
. CALCULO DE PERCENTILES ¿PARA DATOS AGRUPADOS 
Para datos discretos 


Ejemplo 
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X=No de 
artículos por fi F; 
revistas 
14 10 10 
x1> x10=14 
1 1 25 
S 3 x1>xs5=15 
16 20 45 
X2s > xas=16 
17 18 63 
Xx46 > x63= 17 
18 14 77 
X64 > x77=18 
19 6 83 
Xx18 > Xx33= 19 
total 83 


Calcular: D,, Os, Pz 


D,=X =X sg =X s5g+ 0.8( X:sw-X 5) NN 17 + 0.8(17 17) > 17 


(83+1)2 
10 


El 70% de las revistas, tienen menor o igual a 17 artículos, el 
30% de las revistas tienen mayor a 17 artículos. 


O=X  3=X¿=17 


3+1) — 
(8 D y 


El 75% de las revistas, tienen menor o igual a 17 artículos, el 25% de 
las revistas tienen mayor a 17 artículos. 


P,,= X ye = X 0=X + 0.48( Xa-X 0) = 17 + 0.48(17 17) = 17 


(83+1 
0) 


El 72% de las revistas, tienen menor o igual a 17 artículos, el 28% de 
las revistas tienen mayor a 17 artículos 


Para datos continuos 


La formula es: 
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Ml, 
pac + 100,2) %A 


J=1,2,3,4,....99 
Dónde: 


L; = Límite Inferior de la clase que contiene al valor del percentil 


P¡= Valor del percentil que acumular el /%0 de los datos de la 
muestra 
A = Ancho de clase 


F';¡-1 = Frecuencia acumulada absoluta de la clase anterior a la clase 
que contiene al valor del percentil 


Fi = Frecuencia absoluta de la clase que contiene al valor del 
percentil 


Nota: 


La primera frecuencia absoluta acumulada o frecuencia relativa 


acumulada que sea superior al valor "i ¿ _J,serála clase que 
100 100 


contiene al valor del percentil P,. 


Es decir: 


Para los Cuartiles será: 


nio 
O=L+(* A 
f 
J=1, 2, 3 


La relación para ubicar en que clase se encuentra el valor del cuartil es: 
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: J 
F> nn o H2 o 
54 2: AL 
Para los Deciles será: 


e 
D=L+(10 To A 
J l ETS 
Í, 
F=1,2,3,4, 3,b,7,8,9 
La relación para ubicar en que clase se encuentra el valor del decil es: 


F> nj o H> ¿N 
10 : 10 
Ejemplo aplicativo 
La tabla de distribución de frecuencias contiene a las edades (años) de 


los usuarios que concurren a un centro de información: Calcular el 1er 
cuartil, 3er cuartil; 4to. decil y el 65avo percentil. 


Edades de usuarios 

f Í F ñ 
18.5-22.5 5 5 
22.5-26.5 9 14 
26.5-30.5 12 26 
30.5-34.5 20 46 
34.5-38.5 13 59 
38.5-42.5 10 69 
42.5-47.5 4 73 

Total 73 


Cálculo del 1er cuartil 


e 
ES ES 
4 4 ¡ 
n_ 
Oi=Ls +(4 + A4=26.5+ (192314) + 4 - 27.92 años 


f 12 
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El 25% de los usuarios tienen edades menores o iguales a 27.92 años, 
y el otro 75% de los usuarios tienen edades superior a los 27.92 años. 


ás 3er cuartil 
a =54.75 >F>54.75>i=5 clase 


4 4 ¿ 
nj 
Fs; 54.75 — 46 


O=L+( > *A=34.5 t—_— ) * 4 =37.19 años 
7 5 


Interpretación 


El 75% de los usuarios tienen edades menores o iguales a 37.19 años 
y el otro 25% de los usuarios tienen edades superiores a 37.192 años. 


Cálculo del 4to. decil 


nj _13%4_797 >F2292>i=4 


10 10 
U_E 29.2- 26 
DS ELA ) * 4= 31.14 años 
Ja 20 


Interpretación 


El 40% de los usuarios tienen edades menores o iguales a 31.14 años 
y el otro 60% de los usuarios tienen edades superiores a 31.14 años. 


Cálculo del 65 avo percentil 
* 


o 1365 
O 
100 100 


Up 47.45 - 46 
P =L +(100 5-1)*4=345+( )*4 3105 años 
65 $ 
t; 13 


Interpretación 


El 65% de los usuarios tienen edades menores o iguales a 34.95 años 
y el otro 35% de los usuarios tienen edades superiores a 34.95 años. 
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5.5. OTRA MEDIDA DE VARIABILIDAD 
RANGO INTERCUARTIL 


El rango intercuartilico para un conjunto de datos, es la 
diferencia entre el tercer y el primer cuartil, y su valor expresa la 
variabilidad en el 50% central de los datos. 


RIC =03- 0 
Ejemplo 
De la tabla anterior el rango intercuartilico es: 
RIC = 03 -— 01 = 37.19 — 27.92 = 9.27 Años es la variabilidad 
de las edades para el 50% central de los datos 


Aplicando el SPSS para realizar el gráfico de tallo y hojas y el diagrama 
de cajas 


Definiendo las variables 


1 [ComjuntoDeto=0] - IBM SPSS Statistica Edit 
Archivo Edtar Ver Datos Iranstormar Analizar Gráfcos Lilidades Ampliaciones Ventana Ayuda 


ELENA CEE En AA ole 


Hombre Tipo | Anchura |Decimales Etiqueta Valores | Perdidos Columnas Alineación Meda Rol 
[| [Peso_recia Numénco 8 Peso recien na. Ninguna Ninguna 8 3 Derecha — 4 Escala » Entrada 
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Ingresando los datos 


fer Datos Iran Gráficos 120 ¡2 Aguda. 


ARE IA ERA 


: 


¿38 4288 21888 38 NB NIN ASS 


PA IBM SPSS Stababcs Processor está hato Unicode: ON 
| PAS o m4 > oe EA 
En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS—EXPLORAR-pasar la variable Peso_recien_nacido a 
la casilla de la derecha-GRAFICO-marcar de tallo y -CONTINUAR- 
ACEPTAR 


Peso recién nacido Gráfico de tallo y hojas 
Frecuencia Stem 8 Hoja 
1. 


3.00 1. 569 

5.00 2. 01134 

7.00 2 .5566789 

12.00 3.011222233344 
6.00 3 .566779 


1.00 4.1 
Ancho del tallo: 1.0 
Cada hoja: 1 caso(s) 
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Cálculo de los percentiles con SPSS 
Definiendo las variables 


8 "sin tulo! [ConjuntoDatos)] - IBM SPSS Statectica Editor de datos 80 x 
Archivo Edftar Ver Datos Iransformar Analizar Gráficos Ublidades Ampliaciones Ventana Ayuda 


ELIANE ERA 


Tipo Anchura |Decimales Etiqueta Valores Perdidos | Columnas Alineación Megda Rol 


1 ]Peso_recie... Numénco 8 1 Peso recien na... Ninguna —— Ninguna 8 ME Derecha $ Escala ') Entrada 


IBM SPSS Statistics Processor está sto Unicode ON. 
|. = = 
Ingresando los datos 
ME sin tulo! [ConjuntoDatos0] - IBM SPSS Statistics Editor de datos - o x 


Archivo Ear Ver Datos Iranstommar Analizar Gráficos ¡lidades Ampliaciones Ventana Ayuda 


ELEMIGAR- EA E TON 


Peso_seci 
Pal a o nn nr nn [o [o 


O 22 
20 32 
a 32 
al 32 
2 33 
EN 33 
2 33 
26 34 
El 34 
28 35 
29 35 
30 35 
EN 37 
32 3,7 
E] 39 
A 41 


Bla SPSS Statistics Processor está sto Unicode:ON 
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Se elabora la tabla de frecuencias para datos agrupados: 
10. Cálculo del Rango” R*. 


R = peso mayor —peso menor. 
R =4.1-15=2.6 


11. Cálculo del número de clases (K). 
K=1+3.3Log(34) = 6.05388 


Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 


OBSERVACIÓN 


El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o igual a 5, entonces la cifra 
entera del número se incrementa en una unidad. 


Ejemplo: 


Si, K= 6.7, usando el redondeo simple K = 7; 
Si, K= 6.4, usando el redondeo simple K = 6; 


12. Cálculo del ancho del intervalo de clase (A) 

El ancho del intervalo de clase se obtiene a través de la siguiente 

fórmula: 

R 
A=__ 

K 
Para los datos setiene: 
_R_ 26 


K 6 
El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 


A =0.4 


A = 0.43333 
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E=AK-R=0.4(6) - 2.6 = 0.2 
Como el error es negativo, se debe incrementar en una clase 
más(k=7) 
A = O = 0.4 
EA 


E=AK-R=04(7)-2.6=02 


Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 


E 0.2 
valor de arranque= dato menor=_=1.5-= _ =14 


2 E 


En el menú del SPSS, escoger la opción TRANSFORMAR- 
RECODIFICAR EN DISTINTAS VARIABLES-pasar la variable peso- 
recién-nacido al casillero de la derecha, en la derecha en donde indica 
variable de salida Nombre: poner peso_recien_nacido1 y en la etiqueta: 
poner Peso recien nacidol — PRESIONAL LA OPCION CAMBIAR- 
VALORES ANTIGUOS Y NUEVOS-RANGO-poner desde 1,4 hasta 1,8, 
luego en VALOR poner 1 y AÑADIR, así sucesivamente continua con 
todos los rangos de 3,8 hasta 4,2. 


a 
Archivo Estar Yee Datos Iranetomar Analizar Gráficos  ildades Ventana Aguda. 


E 2h he EN md Tola 
A e pa 


— Er 
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a 
Archivo Ear Yer Datos Transformar Apalizar Gráficos iiidades Ampliaciones Ventana Ayuda 


Nombre Tipo — | Anchura Decimales| — Etiqueta Valores | Perdidos | Columnas] Almeación Medida Rol 
1 Peso_recion_nacido Numénco 8 1 Peso recien na. Ninguna Ninguna 8 MU Derecha SP Escala Y Entrada 
4 J| ¡vatorantguo Valor nuevo 
—5 ]]||Ovaor 08 valor [7 
5 O Peraco del sistema h 
73] O Perao ol sistema O optar valores antiguos 
a O Perdido por el sistema o el usuano [ | 
E e Raggo Araque —> Nueve: 
Y | AS 
“ > 
A ES Gama] |2200u25 > 
2 hz ] aos )|25 mu 39 
2 ]| | ORanao, LONWEST hasta elvalor ss * 
“ 00 (14m 388 
E O Rango. valor hasta MIGHEST 
a Las vanagles de saga son seres 
Y 0 Tgóos los demás valores m 
z EEN | 


¡BM SPSS Statistics Processor está histo Unicode:ON 


Cuando se termine de ingresar los rangos presionar continuar y 
aceptar. 
Y se crea una variable Peso_recien_nacido_1. 


48 *Sin tuto [ComguntoDetos0] - IBM SPSS Statistics Editor de datos = AR 
Archivo Edilar ver Datos Iranstomar Analizar Gráficos Lidades Ampliaciones Ventana Amuda 


EXCTUEAETE CIMA EPA 
Home Tipo | Anchura |Decimales| — Eliqueta Valores Perdidos Columnas Alineación Meda. Rol 


Peso_recien_nacido Muménco 8 Peso recien na — Ninguna. Minguna e E Derecha — $ Escala » Entrada 
Peso_tecien_nacido1 Muménco 8 2 Peso recien na — Ninguna Mimguna 21 Derecha — dh Nominal Entrada 


18 SPSS Staten Processor está listo Unicode-ON 
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En la variable Peso_recien_nacido_1, presionar la opción valores e 
ingresar: 


Archivo Ganar Ver Datos Transtomze Analizar Gráficos jfilidades Amptaciones Ventana Apuda 


298 Mm El 


LO Escribe aquí para buscar 


Y Poner aceptar. 

En el Menú del SPSS escoger la opción ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS-FRECUENCIA-pasar la variable Peso recien nacido 1 
al casillero  derecho-ESTADISTICOCO-seleccionar percentiles-en 
casillero de la derecha indicar que percentil se quiere calcular y poner 
añadir-CONTINUAR- ACEPTAR, y nos muestra los resultados 


Archivo Ear Yer Datos Iransfomar Analicar Gráficos imidades Ampliaciones Ventana Ayuda 


ELISA NE EA 


ES Visiola 2 08 2 variables 


E AAA sanactos or”, 
(9 [9 pesorscen nacos ¡Peso secerraca. | e Peso recien nacos [Paso secen_aa. = 
| 


BRE Ra 


181 


EsTADÍSTICa DESCRiptiva y pROBABILIDAd pARa LAs CIENCIAS DE LA INFORMAción CON El USO DE] spss 


Estadísticos 


Peso recien nacido1 


N Válido 34 
Perdidos 0 
Percentiles 5 1,0000 
15 2,0000 
25 3,0000 
50 5,0000 
5.6. Ejercicios propuestos. 
1. Los siguientes datos corresponden a las edades (años) de 50 


pacientes elegidos al azar de un centro de salud de un mes 
determinados 


33,7 
28,0 
21,0 
25,7 
15,0 


27,6 
16,4 
17,7 
27,0 
19,3 


34,1 
21,0 
23,8 
21,6 
30,5 


24,6 
23,9 
24,8 
23,2 
25,1 


25,2 
24,4 
32,6 
28,2 
26,1 


32,3 
24,2 
40,2 
26,9 
27,3 


22,8 
18,2 
13,7 
24,1 


32,4 
29,3 
28,7 
28,3 


24,5 
22,7 
31,6 
39,1 


26,9 25,3 
335 2456 
218 226 
255 24,3 


Elaborar el gráfico de tallos-hojas y caja, y calcular la media, 
mediana, moda, los cuarties, 4to y 7mo avo deciles y el 72 avo 
percentil, rango intercuartilico. Realice comentarios de sus 
resultados. 


2. Los siguientes datos corresponden a las estaturas (metros) de 
50 alumnos elegidos al azar de un instituto de estudios superior. 


1,52 
1,47 
1,71 
1,44 
1,67 


1,64 
1,56 
1,76 
1,68 
1,69 


1,69 
1,72 
1,54 
1,76 
1,67 


1,48 
1,60 
1,73 
1,66 
1,54 


1,53 
1,80 
1,58 
1,42 
1,63 


1,56 
1,68 
1,67 
1,53 
1,65 
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1,86 
1,70 
1,80 
1,69 


1,59 
1,46 
1,75 
1,72 


1,71 
1,50 
1,68 
1,73 


1,76 
1,69 
1,67 
1,74 


1,56 
1,75 
1,49 
1,71 
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Elaborar el gráfico de tallos-hojas y caja, y calcular la media, 
mediana, moda, los cuarties, 3er y 6to deciles y 54 avo 
percentil, rango intercuartilico. Realice comentarios de sus 
resultados. 


3. Los siguientes datos corresponden a los montos por ventas 
semanal (miles de nuevos soles) de 50 grifos elegidos al azar 
de cierta ciudad. 


56,0 65,6 50,0 61,3 78,5 66,0 60,0 58,0 48,2 55,4 43,0 
45,3 50,0 565 56,1 75,9 69,2 51,9 533 740 41,0 55,1 
50,2 50,9 62.0 53,7 43,4 69,6 755 51/99 450 74,6 56,6 
63,2 66,4 48,8 65,8 65,0 49,8 55,2 65,9 60,8 42.0 74,6 
73,6 4319 40,2 40,9 41,8 54,5 


Elaborar el gráfico de tallos-hojas y caja, y calcular la media, 
mediana, moda, los cuarties, 4to y 7mo deciles y el 35 avo y 84 
avo percentiles, rango intercuartilico. Realice comentarios de 
sus resultados. 


4, Los siguientes datos corresponden al número de empleados que 
laboran administrativamente en 50 garitas de peaje elegidos al 
azar de cierta región de un país. 


54565676787 89567657 
66567678789 56765767 
678789567657 


Elaborar el gráfico de tallos-hojas y caja, y calcular la media, 
mediana, moda, los cuartiles, 3er y 8vo deciles y 36 avo y 73 
avo percentiles, rango intercuartilico. Realice comentarios de 
sus resultados. 
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CAPÍTULO 6 
COEFICIENTES DE ASIMETRÍA Y CURTOSIS 


INTRODUCCIÓN 


En esta parte se estudiará la forma de una distribución de frecuencias. 
Las medidas de las formas de una distribución se clasifica en dos: 
medidas de asimetría (desplazamiento de la curva hacia la derecha o 
izquierda) y medidas de curtosis (concentración de los datos con 
respecto a la media aritmética). 


6.1. CONCEPTO DE SIMETRÍA 


Cuando al trazar una recta vertical (en el diagrama de líneas o 
histograma de frecuencias de una variable, según sea esta discreta o 
continua), por el valor de la media aritmética, esta vertical se le llama 
eje de simetría; decimos que la distribución es simétrica cuando a 
ambos lados de la media aritmética existe aproximadamente el mismo 
número de valores de la variable, equidistantes de dicha media dos a 
dos; es decir que cada par de valores equidistantes tiene 
aproximadamente la misma frecuencia absoluta. En caso contrario, 
dicha distribución será asimétrica o diremos que presenta asimetría. 


6.2. MEDIDAS DE ASIMETRÍA 


Las medidas de asimetría indican la deformación horizontal de la curva. 
Cuando una distribución de frecuencias esta inclinada o alargada hacia 
la derecha, se llama asimetría a la derecha o positiva, y si esta 
alargada o inclinada hacia el lado izquierdo, se llama asimetría a la 
izquierda o negativa. Algunos criterios para determinar la asimetría de 
una distribución son: 


. COEFICIENTE DE ASIMETRÍA DE FISHER 
Este valor nos indica el desplazamiento de la distribución de los datos 
con respecto a la media aritmética y se calcula usando las siguientes 


fórmulas: 


Para datos sin agrupador: 
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di (xD, 


Para datos discretos agrupados 


Ms 


Para datos continuos agrupados 


k 


CNA 
A, == ] 


Según el valor de Ay, los datos tendrá una distribución asimétrica a la 
izquierda, asimetría a la derecha o será simétrica, esto es: 


Ay 0, la distribución de los datos será simétrica. Los datos se 
desplazan a la izquierda y derecha de la media aritmética. 


Ap> 0, la distribución de los datos será asimétrica a la derecha o 


asimetría positiva. Los datos se desplazan a la derecha de la media 
aritmética. 


Ay<0 , la distribución de los datos será asimétrica a la izquierda o 


asimetría negativa. Los datos se desplazan a la izquierda de la media 
aritmética. 


Ejemplo 


La tabla de distribución de frecuencia, corresponde a edades (años) de 
usuarios que concurren a un centro de información. 
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Edades (años 

(años) E da F, 
18.5-22.5 3 20.5 3 
22.5-26.5 4 24.5 7 
26.5-30.5 14 28.5 21 
30.5-34.5 12 32.5 33 
34.5-38.5 5 36.5 38 
38.5-42.5 4 40.5 42 

Total 42 


La distribución de frecuencias de las edades, que tipo de asimetría 
tiene. 


Cálculos: 

6 

7 
x= El =30.7857143 

n 
6 

Y 04 A 

ys == = 27.4285714> s = ,/27.4285714 =5.23722937 


n-1 
6 


Daria)? 1 =235.101993 
ns =42 * (5,23722937)' =6033.28824 


fis 235.101993 _ 0.0389>0 
f  6033.28824 


La distribución de las edades es ligeramente asimétrica positiva, es 
decir los datos tienen un desplazamiento casi a ambos lados de la 
media aritmética. 


. COEFICIENTE DE ASIMETRÍA DE PEARSON 
Este coeficiente de asimetría se utiliza cuando se conoce los valores de 
la media aritmética, mediana, moda y desviación estándar. 

_x—Mo _3(x—-mM+) 


P Ss Ss 
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Esta formula se aplica, cuando la distribución de frecuencias de los 
datos unimodal. 


Ap=0 , la distribución de los datos será simétrica. Los datos se 
desplazan a la izquierda y derecha de la media aritmética. 

Ap> 0, la distribución de los datos será asimétrica a la derecha o 
asimetría positiva. Los datos se desplazan a la derecha. 

Ap<0 , la distribución de los datos será asimétrica a la izquierda o 
asimetría negativa. Los datos se desplazan a la izquierda. 


De la tabla de distribución de frecuencias anterior, calcular el 
coeficiente de asimetría de Pearson. 


De la tabla: 


x =30.7857143 

me= 30.5 

s =5.23722937 

4 360.7857143- 30.5) _ 


0.1636 
al 5.23122937 


Las edades, tienen una distribución asimétrica a la derecha. 


. COEFICIENTE DE ASIMETRÍA DE BOWLEY 
Este coeficiente se utiliza, cuando no es posible calcular la media y 


desviación estándar 
a -Q +93 20 
b 


03-01 


Siendo: 

0O¡= Valor del primer cuartil 

0,= Valor del tercer cuartil 

0,= Valor del segundo cuartil 

A,= 0, la distribución de los datos será simétrica 


A,> 0, la distribución de los datos será asimétrica a la derecha o 
asimetría positiva. 
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A»<0 , la distribución de los datos será asimétrica a la izquierda o 
asimetría negativa. 


De la tabla de distribución de frecuencias anterior, calcular el 
coeficiente de asimetría de Bowley. 


De la tabla: Q,=275  0Q,=30.5  Q,=34, reemplazando valores 


_27.5+34-2(30.5) 
b 34 -27.5 


A = 0.08 


Las edades, tienen una distribución asimétrica a la derecha. 
6.3. COEFICIENTE DE CURTOSIS 


La curtosis es la deformación vertical (apuntamiento) de una 
distribución de frecuencias. Este coeficiente determina el grado de 
concentración de los datos con respecto a la media aritmética; se 
calcula cuando la distribución de frecuencias tiene la forma simétrica 
(forma de campana). El coeficiente de curtosis se calcula por la 
siguiente fórmula: 


Para datos no agrupados 


AD, 


= ¿sl -3 
e 4 
Para datd$ discretos agrupados 
Nu) $ 
4 i 
k == -3 
di Para datos continuos agrupados 
k 
Niaraf 
k = El -3 
ns 


k=0, la distribución será mesocúrtica o normal, concentración normal 
de los datos con respecto a la media aritmética. 

k> 0, la distribución será leptocúrtica o mas apuntada que la normal, 
alta concentración de los datos con respecto a la media aritmética 
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k<0, la distribución será platicúrtica o menos apuntada que la normal. 
baja concentración de los datos con respecto a la media aritmética 


Otro coeficiente de curtosis en función de cuartiles y percentiles es: 
_ 03-01 
2(Po0— P10) 
k= 0.263, la distribución de frecuencias será mesocúrtica o normal 


k > 0.263, la distribución de frecuencias será Leptocúrtica más 
apuntada que la normal, los datos se encuentran más concentrados a 
la media aritmética k< 0.263, la distribución de frecuencias será 
Platicúrtica, menor apuntada que la normal, los datos se encuentran 
menos concentrados a la media aritmética. 


Ejemplo aplicativo: 


La tabla de distribución de frecuencias, corresponde a las edades 
(años) de 42 usuarios que concurren a un centro de información. 


Edades(años) q XxX; 
18.5-22.5 3 20.5 
22.5-26.5 4 24.5 
26.5-30.5 14 28.5 
30.5-34.5 12 32.5 
34.5-38.5 5 36.5 
38.5-42.5 4 40.5 

Total 42 


¿A que tipo de apuntamiento corresponde la distribución de las edades 
de los usuarios?. 


Cálculos: 


Y xi 1)f ¡=81,260.2216 
El 
6 


Nip ¡=1124.57143 


El 
ha 42(81260.2216) 


— 3 =2.698691- 3 = -0.301309< 0 
(1124.57143) 
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La distribución de frecuencias de las edades será platicurtica. 
Usando el otro coeficiente se tiene: 


De la tabla de distribución frecuencias se tiene: 
QO,= 34 

Q¡=27.5 

Poy = 38.34 


x= 2-4 - A — 079199 


ZAPow—Pi) 2(38.34 23.7) 


La distribución de las edades será platicurtica; esto implica que las 
edades de los usuarios están poco concentrados con respecto a la 
media aritmética. 


Otra fórmula para calcular el coeficiente de curtosis: 
[o nan+1) e al 3(n 1) 
Nu 


(n—-DM-2(1-3) 21 s  ) (n-2Xnm-3) 


3 
Il 
A 


Siendo: xys la media aritmética y la desviación estándar 


respectivamente. 
k=0, la distribución será mesocúrtica o normal, media concentración 
de los datos con respecto a la media aritmética. 


k> 0, la distribución será leptocúrtica o mas apuntada que la normal, 
alta concentración de los datos con respecto a la media aritmética 


k <0, la distribución será platicúrtica o menos apuntada que la normal. 
baja concentración de los datos con respecto a la media aritmética 


Aplicando el SPSS para realizar el cálculo de la simetría, asimetría, 
curtosis 


Definiendo las variables 
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UE Sin ttulo! [ConjuntoDetos0] - IBM SPSS Statistics Editor de datos -.90 x 
Archivo Editar Yer Datos Iranstormar Analizar Gráficos Ulidades Ampliaciones Ventana Ayuda 


ECT ELO ERSSTO 


Nombre Tipo | Anchura ¡Decimales Etiqueta Valores | Perdidos | Columnas | Alineación Medida Rol 
1 Peso recie.. Numénco 8 1 Peso recien na... Ninguna Ninguna 8 2 Derecha — 4 Escala » Entrada 


IBlA SPSS Statistics Processor está listo Unicode ON: 


Ingresando los datos 


MA sin tulo! [ConjuntoDatos0) - IBM 595S Statistics Editor de datos. a -l x 
Archivo Ear Yer Datos Transformar Analizar Gráfcos Ullidades Ampliaciones Ventana Ayuda 


ECT IAE ELM ERA 


Visible-1 08 1 variables 


var vor sa vo var var so sa var 


333 
se 
ti 
3 
á 
á 
ú 
á 
ú 
á 


UNNANNENMA NN 


84 SPSS Statistics Processor está hsto Unicode ON 
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En el Menú del SPSS escoger ANALIZAR-ESTADÍSTICOS 
DESCRIPTIVOS—FRECUENCIA-pasar la variable Peso_recien_nacido 
a la casilla de la derecha-ESTADISTICOS-caracterización posterior 
marcar asimetría y curtosis-CONTINUAR-ACEPTAR 


Arcrivo Editar ver Datos Transformar Analizar Gráficos LMidades Ampliaciones Ventana Ayuda 


20488 a PAE AE ole 


¡4 al ES Frecuencias Estadisticos x var rar 
Yanables 


Í 
Valores percentiles Tendencia central AAA 


: de Peso recon nacio! [Peso_yecien_pac 

2 Cuarties Meca 

3 Puntos de corte para: grupos iguales Megana 

E Percentiles: Moca | 

5 — Suma 

a E 

A > 

A a 

s 


| 
10 Los valores son puntos medios de grupos 


“ Dispersión Caracerzar disibución postonce 
12 Desvizcón estándar Mínimo Y Asimenta 
n Varianza Mágmo ¡Y [Cunosia 
1“ Rango Error estándar media 
15 
15 ESE 
7 371 50 
18 31 5.00 
19 32 5.00 
20 32 5.00 
21 32 5.00 
2 32 5.00 
2 33 5.00 
a 33 5.00 
25 33 5.00 
25 34 5.00 
AMA 34 5.00 
2 35 6.00 | 
36 6.00 
so 35 6.00 | 
31 37 5.00 Y Mostrar tablas de frecuencias. 


Er] 37 6,00 
== : 7.90 Lsestar JL_fvaar_) Bestantace | Cancelar ] amos 


18h SPSS Stabshcs Processor está listo Unicode. ON 


Estadísticos 


Peso recien nacido1 


Asimetría -,308 
Error estándar de asimetría 403 
Curtosis -,728 
Error estándar de curtosis ,788 
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6.4. Ejercicios propuestos 


1. En una agencia bancaria, el tiempo (en minutos) de atención a 
los 70 clientes se presenta en la siguiente tabla de distribución 
de frecuencia: 


Tiempo (minutos) fi 
[1.5 2.0) 2 
[2.0 2.5) A 
12 
[2.5 3.0) 30 
[3.0 3.5) 12 
[3.5 4.0) 6 
[4.0 4.5) 2 
[4.5 5.0) 
Total 70 


Hallar e interprete el coeficiente de asimetría y el coeficiente de 
curtosis. 


2. Los datos que a continuación se presentan corresponden a 
edades de 60 usuarios que concurren a un centro de información 
(biblioteca) 

Edad(años) f. 
18.5-22.5 4 
22.5-26.5 24 
26.5-30.5 15 
30.5-34.5 10 
34.5-38.5 5 
38.5-42.5 2 

Total 60 


Hallar e interprete el coeficiente de asimetría. 
3. Los datos que a continuación se presentan corresponden a 


edades de usuarios que concurren a un centro de información 
(biblioteca) 
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Edad(años) h; 
12-14 0.02 
14-16 0.2 
16-18 0.56 
18-20 0.2 
20-22 0.02 
Total 1.0 


Hallar e interprete el coeficiente de curtosis. 


4. Los datos que a continuación se presentan corresponden a las 
estaturas (mts.) de 44 alumnos elegidos al azar, de la 
universidad Nacional Mayor de San Marcos. 


Estaturas (mts) f 
1.65-1.68 3 
1.68-1.71 10 
1.71-1.74 17 
1.74-1.77 
1.77-1.80 4 
1.80-1.83 2 

Total 44 


Hallar e interprete el coeficiente de asimetría. 


5. Los datos que a continuación se presentan corresponden a 
montos por ventas (miles de nuevos soles) de 60 
establecimientos comerciales de Lima Metropolitana. 


Montos de ventas fi 
12.5-17.5 2 
17.5-22.5 5 
22.5-27.5 23 
27.5-32.5 23 
32.5-37.5 5 
37.5-42.5 2 

Total 60 


Hallar e interprete el coeficiente de curtosis. 
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CAPÍTULO 7 
VARIABLES BIDIMENSIONALES 


INTRODUCCIÓN 


En esta CAPÍTULO se estudiaran las variables bidimensionales, las 
cuales se presentan cuando se observan en forma simultánea dos 
variables (X;Y) en la unidad elemental, en una población o muestra 


aleatoria. 


7.1. VARIABLES BIDIMENSIONALES 


Las variables bidimensionales ( X , Y ) pueden ser ambas cualitativas 
o cuantitativas o bien una mezcla de ambas. Cualquiera que sea el 
caso los datos se clasifican bajo dos criterios y se presentan en tabla 
de doble entrada o tabla de contingencia. 


Ejemplos: 


. Estaturas y pesos de los alumnos de la Universidad Nacional 
Mayor de San Marcos 

. Sexo y Opinión de los encuestados 

. Número de heridos y causas de los accidentes de transito 


. Gasto e ingreso de los jefes de familia 


. Altura y diámetro de los árboles 

. Grado de instrucción y adaptabilidad al matrimonio de los _ 
cónyuges 

. Número de personas y cantidad de habitaciones en una casa 


Supongamos que la variable X se clasifica en “m” clases y la variable Y 


en “k” clases. Cada f, nos indica el número de veces que la unidad 


elemental presenta la clase X, e Y; simultáneamente, 


obteniéndose de esta forma una distribución conjunta de las variables 
X e Y. Ver tabla 01 
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Tabla 01 
Total 

X 

X fi Í, Fa di 
X 2 La: £, L, £, 
X m dal e 2 E Ej 
Total f, f, Í, a 

Ejemplo 


De 98 Tesis de Física elegidas al azar, se observó simultáneamente 


dos variables de interés: 


X = Sexo del autor de la tesis 
Y = Calificativo en la sustentación 


Tabla 02 


Distribución conjunta de las frecuencias de las variables, sexo del autor 
de la tesis (X) y calificativo en la sustentación (Y) 


Calificativo 
Sa Excelente Ela Bueno | Regular | Total 
Varón 12 15 12 47 
Dama 10 20 15 51 
Total 22 35 27 98 
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Fuente: Biblioteca Central de la Universidad Nacional Mayor de San 
Marcos 


Interpretación: 


Fi =8 (Significa que existen 8 tesis de física que corresponden a 
varones y obtuvieron el calificativo de excelente). 


Ff. =47 (Significa que existen 47 tesis de física, cuyos autores son 
varones,). 


f> =22(Significa que existen 22 tesis de física que obtuvieron el 
calificativo de muy bueno. 


La Tabla 02, también puede presentarse por sus frecuencias relativas 
para cada casillero. 

Tabla 03 
Distribución Conjunta de las frecuencias relativas porcentuales de las 
variables, sexo del autor de la tesis (X), y calificativo en la sustentación 
(M 


Calificativo Excelente Muy Bueno Regular | Total 

Sexo Bueno 

Varón 8.16% 12.24% | 15.31% | 12.24% | 47.96% 

Dama 6.12% 10.20% |20.41% | 15.31% | 52.04% 

Total 100.00 
14.29% 22.45% |35.71% |27.55% | % 


Fuente: Biblioteca Central de la Universidad Nacional Mayor de San 
Marcos 


7.2. DISTRIBUCIONES MARGINALES 


Si de la tabla 01, consideramos sólo los totales para las categorías de 
X , sin tener en cuenta las categorías de Y, se obtiene la distribución 
marginal de X ; es decir: 
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TABLA DE DISTRIBUCIÓN MARGINAL DE X 


x 14 


XA 
X2 F, 


Total f 


De la misma forma la distribución marginal para Y será: 


TABLA DE DISTRIBUCIÓN MARGINAL DE Y 


E lo 


Y f, 
Y, f, 
Y, F, 


Total | f 


7.3. DISTRIBUCIONES CONDICIONALES 


Se obtiene al poner una restricción o condición a una de las dos 
variables; es decir: 
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Distribución condicional de X dado Y , se simboliza por: sx 


TABLA DE DISTRIBUCIÓN CONDICIONAL DE x 


XxX 

Vx Y, 
X e 
X2 Fo, 
Am 
Total Ts 


También la distribución condicional de Y dado X , se simboliza por: 


Y 
Ax 


TABLA DE DISTRIBUCIÓN CONDICIONAL DE 


Y X, 
/x=x 
Y; 


Y, F 


Total A 
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7.4. INDEPENDENCIA ESTADÍSTICA 


Se dice que dos variables X e Y , son independientes 
estadísticamente, cuando las frecuencias relativas conjuntas es igual al 
producto de las frecuencias relativas marginales para todas las celdas 
de la tabla 01; es decir, 


Si 


n n n 


i 


Si esta condición no se cumple para todas las celdas, se dice que hay 
dependencia estadística. 


Medias y Variancias Marginales: 


De la tabla 01 sea la variable bidimensional (X Y). Las medias y 


variancias marginales de X e Y son dadas por: 


Ñ E 


yal 
n 
k 
Ne xy f, 
52 — El 
k y n 
E 2 
_ dEl 
y n 
yy 
2 _ El 
sy = A 
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Ñ ¡=1,2,3,...k 
Siendo: N = Y Ln e 1 E 
i=l j=1 ¡ 


7.5.  COVARIANCIA 


Es el estudio de la variabilidad conjunta de dos variables aleatoria, la 
medida que se utiliza para cuantificar esta relación es: 


NY DO 0 DY iy —nxy 


¡=1 _ el j=1 


S, =Cov(x, y)= ELL 


n n 


LE as 
="( o 
Sn 


Ds >0> Hay dependencia lineal directa (positiva); es decir a 
grandes valores de X, corresponden grandes valores de Y. 


mm =0> No hay dependencia lineal entre las variables (están 
incorrelacionadas); es decir no hay relación lineal 


de <0> Hay dependencia lineal inversa o negativa; es decir a 


grandes valores de X, corresponden pequeños valores de Y, 
. Propiedades de la Covariancia 


1. Si atodos los valores de la variable Xe Y les sumamos una 


constante k ; la covariancia original no cambia. 


e do 
2. Si a todos los valores de la variable , les multiplicamos 


por una constante k, y ko respectivamente, la 
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covariancia original queda multiplicada por el producto de las 
constantes. 


Sea Do la covariancia de la variable bidimensional Xe Je, 


sean las transformaciones lineales para cada variable 
z=ax+b,w=Cy+ dl, la nueva covarianza es dada por: 


S., = CS, 


Coeficiente de correlación lineal de X e Y 


El inconveniente de la covariancia, como medida de asociación es su 
dependencia de las unidades de medidas que utiliza. Para salvar esta 
dificultad, se define otra medida de la asociación como la correlación, 
que no está afectada por las unidades de medidas. 


_ Cov(x, y) 
y aa 
Sd, 
Ejemplo aplicativo 
Sea la tabla de datos 
Tabla 01 
N* de 
hijos() 4 2 4 3 2 
N* de 
dormitorios 2 1 2 1 2 
(Y) 
Elaborar la tabla de distribución de frecuencias de X e Y 
Tabla 02 
(Y) 
1 2 Total 

(x) 

2 3 1 4 

3 2 1 3 

4 0 2 2 

5 0 1 1 

Total 5 5 10 
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Hallar las distribuciones marginales de X e Y 


Distribución marginal de X 


Tabla 03 
Xx Fx 
2 4 
3 3 
4 2 
5 1 
Total 10 
Distribución marginal de Y 
Tabla 04 
Y o 
1 5 
2 5 
Total 10 
Distribución condicional de Y dado X=3 
Tabla 05 
Y F(y/x=3) 
1 2 
2 1 
Total 3 


Calcular la covariancia 
Utilizando la td de la covariancia, con los datos de la tabla 02 
A Ni 4 
Se 10 Do xy 
i=1 


Jl 


gs 600 + 0018) + 0060) + 06)0) + 0440) + (60) - 31.5) 
” 10 


S, =03 


Calcular la variancia marginal de X 
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pS la tabla 03 


Y x,f. =2(4) + 3(3) + 4(2) + 5(1) =30 


i=l 


Y ey = 2 (4)+32(3)+ 4 (2) +5*(1) =100 


i=l 
100- G0y 
s? = 10 =1 
: 10 


Calcular la variancia marginal de Y 


De la tabla 04 


Y y. = 18) +25) =15 


Za Pf, =P (5)+22(5)=25 


a 
s¿- 25 
10 


Calcular el coeficiente de correlación de X e Y 


Utilizando la formula de la correlación y los cálculos obtenido 
anteriorm gente 
xy 


r=_"=_ 03  =06 
E, 2/1/0.25 
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De otra forma de la tabla 01 


Y 11); =48 
cs 

Y x, =30 
1 

>) x= 100 
e 

Y, y: = 15 
i=l 


10 
ya ye=25 
El 


El coeficiente de correlación de Xe Y 


10 10 


10 QO, y) 


Dx, RARO 48 - 098 e 
, l¡=1 10 2 157 
des | > 2 | S > hoo— Ea pas a 
108 2) an (257) V TON 10 
Mar? lo. MA 
3 
3 = >» 06 


Fxy = 


"310.05 <25 3 


Aplicando el SPSS para realizar tablas cruzadas o de contingencia 


Definiendo las variables 
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$ "sin tuto? [ConjuntoDatos0] - IBM SPSS Statsstacs Editor de datos - o x 
Arciwo  Eoñar Ver Dtos Iranstommar Amalizss Gráficos Ulidades Ampliaciones Ventana Ayuda 


ECM TED MA EAS 


Nombre Tipo] Anchura |Decimales — Etiqueta Valores | Perdidos | Columnas | Alineación Meda] Ral 
o Sexo Mimguna Ninguna 8 E izquierda — gh Nominal O Entrada 
o Calicación de 1 Mimguna —— Minguna 8 HE izquierda — di Mominal 0 Entrada 


Sexo Cadena a 


: 
B 
8 
3 
E 
a 
i 


¡DIA SPSS Stanevcs Processor está nato Unicode-ON 


Ingresando los datos 


M2 sim tulo! [ConguntoDetos0) - IM SPSS Statistics Editor de datos - =] x 
Archivo Ectar Yer Patos Iranstormar Analirar Gráficos Lidaces Ampliaciones Ventana Ayuda 


Vizsble: 2 de 2 variables 


A E aa ES == E = ze y mo 


Varon. Excelente 
Varon. Excelente 
Varon Excelente 


Varon Excelente 


En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS—TABLAS CRUZADAS-pasar la variable sexo a la 
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casilla filas y la variable Calificacion de la tesis la columnas -CASILLAS- 
CONTINUAR-ACEPTAR 
% 


Aychtas —Fellar Une Malos — Transformar —Analirar Gráficas — lilidacies —Ameliaciónas — Ventana — dada 


] 


| 
1 Ellas 
y | 7 [de seo ise Visile 2 08 2vanabies 
| a Tobls creados Mostar en los caos x | “ 


Columnas: 
a Recuentos Pruetar 
>| Y|Qoservado ] Comparar las proporciones de columna. 
Pr e AT 
Capa 10 1 l Ocytar recuentos pequeños 
Porcentajes Residuos 
5 Ena No estandanzados 
Columna Estancarizados 
n 1 Y 1otal Estancarizados corregidos 
Mastraslos gráficos de barras agrupadas == 
tipa cuentos de casillas O Bedondear ponderaciones de casos 
Lseoptar_) epa) [ Bestabiocer) | Cancelar ¡| Aguda] Il O rruncarrecuentos de castlas — O) Truncar pongeraciones de casos 
AT” ains | O no etecuar correcciones 
16 Varon Muy bueno 
Y Varon Muy bueno Lcenmoa)] E Canosa) 
” Varon Muy bueno 


19 Varon Muy bueno 


Bl SPSS Statistics Processor está Bsto Unicode: ON 


Tabla cruzada Sexo*Calificacion de la tesis 


Calificacion de la tesis Total 
Muy 
Bueno Excelente bueno Regular 

SexO Dama Recuento 20 6 10 15 51 
% del total 20,4% 6,1% 10,2% 15,3% 52,0% 

Varon Recuento 15 8 12 12 47 

% del total 15,3% 8,2% 12,2% 12,2% 48,0% 

Total Recuento 35 14 22 27 98 
% del total 35,7% 143% 224% 27,6%  100,0% 
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7.6. Ejercicio propuesto: 


a. Elaborar una tabla de doble entrada con los datos que 
se presentan a continuación. 
Sexo ViÍDIV.D|[V|D|[DÍ[D[V|[D|V|D|D D 
Candidato | A|C|B|JA | A|B|A|B|A|A|C|AI|B|A 
Sexo DIV|V|D|V|V|D|D|V|D|D|V|D|D 
Candidato | B| A[BJA A[B|A|C|A|A|B|A|A|A 


Con la información elaborar la tabla de doble entrada e interpretar 
algunos resultados. 


b. Los siguientes datos corresponden a una encuesta 
tomada a 56 alumnos de la Universidad Nacional 
Mayor de San Marcos, con la finalidad de evaluar los 
servicios que prestan a los usuarios la biblioteca 
Central. 
C. 
Sexo DIV|¡V|V|[D|D|D|V|D[V|D|D|D 
Servicio RIB|RIM|[R|[B|JM|R|R/[B|B|B|R 
Del Cl 
Sexo D|V.D VÍDD D VID|V|DIDI|D 
Servicio MIÍRÍR B|[B|M|[BB | M|R|R|B|B B 
Del Cl 
Sexo DIV|ÍD[V|.D D D|V|[D|[V|D|D|D 
Servicio B|IR|IR|B|R|IR B|ÍRÍR|IB|R|[MI|R 
Del Cl 
Sexo DIV|ID[V|[D[D|D V|[D[V|[D DD 
Servicio B|JB|M|R|B|[M[B B|R|[M|RR | [BM 
Del Cl 
LEYENDA 
SEXO: V=VARON M= MUJER 


SERVICIOS DEL Cl (Centro de Información): M=MALO 
R=REGULAR B= BUENO 

Con la información elaborar la tabla de doble entrada e interpretar 

algunos resultados. 
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CAPÍTULO 8 
INTRODUCCIÓN 


En este capítulo, se estudia la relación lineal o no lineal entre dos 
variables ( X ,Y) con el objetivo de conocer si estas están asociadas o 


dependientes 
8.1. COEFICIENTRE DE CORRELACIÓN DE PEARSON 


Es un valor que mide el grado de asociación lineal entre dos variables 
cuantitativas ( X,Y >) 


Sean (x,, y,) , (%2, ya), (03, y3) - - - > (Xu, yn) datos de dos variables de 


una muestra aleatoria de tamaño M extraídas de una población. El 
coeficiente se calcula por la fórmula: 


Na-00 =» Ey RRA 


= ii 


n 


fp = n 5 n | n | n 
oo Lo -»* 2 AN y? 
| El ds Oz ed 


Vo la 

W l 
Si r,= 0, entonces los valores que toma la variable ( X ,Y ), no están 
asociadas linealmente. 


Si rp> 1,entonces los valores que toma la variable ( X Y), están 
asociadas linealmente; es decir, si X crece, también Y crece 
(viceversa). 


Si r, >-—1, entonces los valores que toma la variable ( X,Y), están 
asociadas linealmente; es decir, si X crece Y decrece (viceversa). 


Ejemplo 


Se eligen al azar 10 estudiantes y se registran sus notas de estadística 
| y estadística ll, tal como se presenta en el cuadro: 
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X Y 
13 13 
12 12 
14 15 
15 15 
16 17 
14 16 
13 14 
15 16 
11 12 
13 15 


¿Se encuentran los datos correlacionados? 


Calculando las sumatorias 


10 10 


10 10 10 
Y xy =19983  Pu=136  Dhr=145 Y a=1870  D y=2129 


= 


1993 (136,145) 


r = = 0.9032 
2 


1870 . 2129 143 
NW 10 Y 


10 


Conclusión: las notas de los estudiantes obtenidas en el curso de 
estadística | y Il están asociadas o correlacionadas linealmente 


8.2. COEFICIENTE DE CORRELACIÓN DE RANGOS DE 
SPEARMAN 


Es un valor que mide el grado de asociación lineal o no lineal entre dos 
variable cualitativas ordinales o jerárquicas (X,Y), los datos de ambas 


variables se ordenan por rangos creciente o decreciente 


Para una muestra aleatoria de tamaño Ml , sea (x,x,x,.x) los 
1 2 3 n 


datos de la primera variable con sus rangos correspondientes 
(a, x,... xx"); para los valores de la segunda variable 
1 2 3: 


n 
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(y,y,y.... y ) con sus rangos correspondientes ( y”, y”, y',..., y) - 
1 2 3 n 1 2 3 


El coeficiente se calcula por la fórmula: 
7 


6. Yd 4 
nl 


r =1-0 
s n(n? —1) 


n 


Donde: d =x' — y 


Si r,=0, entonces los valores que toma la variable ( X ,Y ) , no están 
asociadas. 


Si r, > 1, entonces los valores que toma la variable ( X Y), están 


asociadas; es decir, si X crece también Y también crece 
(viceversa). 


Si r, >-—1, entonces los valores que toma la variable ( X,Y ), están 
asociadas; es decir, si X crece Y decrece (viceversa). 


Nota 

Cuando hay empates de rangos, tanto para los valores de X como Y , 
al momento de asignarle sus rangos, se asigna a las observaciones 
empatadas la media aritmética de los rangos se cumple que 

Ejemplo 


X 7 6 5 6 4 

5 3 2 4 1 

r 5 3.5 2 3.5 1 
Nota 


Cuando no hay empates de rangos, tanto para los valores de X como 
Y , se cumple que el coeficiente de correlación de Spearman es igual al 
coeficiente de correlación de Pearson calculado por los rangos. 


r,= Yo 
Nota 


Cuando hay algunos empates de rangos, tanto para los valores de X 
como Y, el coeficiente de correlación de  Spearman es 
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aproximadamente igual al coeficiente de correlación de Pearson 
calculado por los rangos. 


Ejemplo 


Se eligen al azar 7 estudiantes y se registran las X =horas de estudios 
dedicados a la asignatura de matemática con sus correspondientes 
Y = notas obtenidas a la referida asignatura: 


X Y 
8 12 
5 11 
11 14 
13 15 
10 13 
5 12 
8 13 


¿Calcular el índice de correlación de Spearman? 


Se calcula los rangos para cada variable 


Xx Y x; y d; => da y : di 
8 12|35|25 1 1 
5 11115 1 0.5 0.25 
11 14| 6 6 0 0 
13 15| 7 7 0 0 
10 13| 5 |45 0.5 0.25 
5 12/15/25 -1 1 
8 13|35| 45 -1 1 
total 3.5 
Usando la formula , 
6.» d E 6.» d Ñ 6(3.5) 
r =1- 01 =1- A =1-— =0.9375 


s nm? —1) TP =D 7(49 —1) 


Conclusión: las horas de estudio dedicadas a la asignatura matemática, 
están asociadas a las notas obtenidas. 
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Aplicando el SPSS para realizar el Índice de correlación de Pearson 


Definiendo las variables 


Meda Rar 
o A Escala Y Entradi 
Derecha SP Escala Y Entrado 


E 


= ju [ula 


ee lelata! 


Ingresando los datos 


Ú “Sin titulo? [ConjurtoDatos!] - IBM SPSS Statatcs Editor de detos - 0 
Arco Estar Yer Datos Iranstoma gnalicar Gráficos Lblidades Ampliaciones Vertana Ayuda 


ELE EA IP Maa dole 


101 Vaitie 2 de 2 vanaoles 


éx és var var sa 1 var sar var a sa e sar 
[ . 


BM SPSS SRanstcs Processor está sto "Unicode: Om 


a 
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En el Menú del SPSS escoger ANALIZAR-ESTADÍSTICOS 
DESCRIPTIVOS—TABLAS CRUZADAS-pasar la variable X y la 
variable Y al casillero de la derecha, marcar Pearson-ACEPTAR 


8 Sino? [CorgunteDatos1] - 18M SPSS Sstitics Editor de detos o 
Archivo Editar Yer Datos  Iramsformar Analizar Gráficos Ulidades Ampliaciones Ventana Ayuda 


Da a 
23948 a HA MAE ¿ole 
Visible: 2 de 2 vanables 
Px éN ar a a a a var ar 
1 a LE] 
2 12 12 e 
3 “ 15 A 
4 15 5 Pi Lopaones. 
6 “ 16 | 
7 1 “ | 
8 15 16 y | 
3 $“ 12 
1 3 5 
" 


Coecientes de correlación 
Y Pearson 7 Tau-b de Kendall /7 Spearman 


Prueba de significa 
8 Etatoral O Untateral 


Y Señatarlas correlaciones significativas 


[oeestar )._ pega) lfestabiecer] Cancelar |Ayuda) 


IBM SPSS Statistics Processor está hsto Unicode: ON 


Correlaciones 
Xx Mi 

Xx Correlación de Pearson 1 903” 

Sig. (bilateral) ¿000 

N 10 10 
Y Correlación de Pearson 903” 1 

Sig. (bilateral) ,000 

N 10 10 
**. La correlación es significativa en el nivel 0,01 


(bilateral). 


Aplicando el SPSS para realizar el Indice de correlación de Spearman 
Definiendo las variables 
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M2 sin títulos [ConjuntoDatos2) - IBM SPSS Statistics Editor de datos - =] x 
Archivo Editar ver stos Iransformar ánalirar Gráficos [lidades Ampliaciones Ventana Ayuda 


ECTS EE LIME 


Nombre. Tipo. Anchura Decimales Etiqueta Valores Perdidos Columnas Alineación Medida Rol ] 

] x Numérico |8 o x Minguna —— [Nimguna a ME Derecha $ Escala YN Entrada 
2 Y Numérico 8 o Y Ninguna Ninguna 8 Derecha — $ Escala YN Entrada 
5 

5 

- 

- 

- 

- 

3 

: 

LES 

Ene 

- 

> 

= 

a 

1 

- 

- 

z2 

= 

- 

2 == 
> 

- 

> 

> 

> 

- 

3 

= 
Esa 


¡Bla SPSS Stasstcs Processor está hato Unicode: ON 


Ingresando los datos 


42 Situ [ConjuntoDatos2] - IBM SPSS Staiic Eto de datos - 0 x 
Archivo Editar Yer Datos  Iramsformar Analizar Gráficos |Mlidades Ampliaciones Ventana Ayuda 


31480 a BAH ARE ole 


1 
éx PY a var e] va var. var var var ar var var var var w 
8 


"IBM SPSS StaBistcs Processor está histo Unicode:ON- 
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En el Menú del SPSS escoger ANALIZAR-ESTADÍSTICOS 
DESCRIPTIVOS—TABLAS CRUZADAS-pasar la variable X y la 
variable Y al casillero de la derecha, marcar Spearman-ACEPTA 


UE "Sin título3 [ConjuntoDatos2] - IBM SPSS Statistics Editor de datos - [=] 
Archivo Editar ver Datos Iransformar Analiwar Gráficos Ullidades Ampliaciones Ventana Ayuda 


ELENA ELA EOS 
: PLD PT A POCA ET rs e [A | PEE 


Visinle: 2 de 2 vanables 
a i 


1 8 12 ta 
2 5 ”“ 
3 " “. yanables E 
a PE 
4 a 15 
Y 
5 10 1” éxm 
6 5 a 
7 a e Le) 
, 
10 
í 
Lo nal! ¡Y) Spearman 
5 
'B 6 Bilateral O) Undateral 
45 Y Señalaras correlaciones significatas 
1 Lscegtar Jl pegar) festanteces | Cancelar | apuca 


IBM SPSS Statistics Processor está hsto Unicode: ON 


Correlaciones 
Xx Y 
Rho de Xx Coeficiente de 1,000 ,787 
Spearman correlación 
Sig. (bilateral) ] ,036 
N Le 7 
Y Coeficiente de ,787' 1,000 
correlación 
Sig. (bilateral) ,036 
N 7 7 


*. La correlación es significativa en el nivel 0,05 (bilateral). 
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CAPÍTULO 9 
TÉCNICAS DEL CONTEO 


INTRODUCCIÓN 


El objetivo de este capítulo es presentar las formulas y técnicas que 
permiten determinar el total de grupos que se pueden formar con los 
elementos de uno o más conjuntos. Los grupos formados pueden ser 
sin reemplazo o con reemplazo y a la vez tomando en cuenta o no el 
orden de sus elementos. 


Sean los dígitos $ 12.3 , , se eligen 2 dígitos para formar un número, 
determinar los números formados: 


12 18 23 sin reemplazo y sin orden 
12 13 23 

21 31 32 sin reemplazo y con orden 
2 15 253 

11 22 33 con reemplazo y sin orden 
12 18 23 

da con reemplazo y conorden 
11 22 33 


Orden, es permutar los elementos dentro del grupo 
Sin reemplazo, el elemento elegido aparece una solo vez en el grupo 
Con reemplazo, el elemento elegido aparece más de una vez en el 


grupo 
9.1.  Conun solo conjunto 


. Si se tiene un conjunto con n” elementos diferentes, 
todos los posibles grupos que se pueden formar, si se 
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toman “r” elementos (para r< mn ), sin tomar en cuenta el 
orden y sin reemplazo, es dado por: 


no n! 
"— rin-—pn! 
. Si se tiene un conjunto con “n” elementos diferentes, 


todos los posibles grupos que se pueden formar, si se 
toman “r” elementos (para 7 £ ), sin tomar en cuenta el 
orden y con reemplazo, es dado por: 

cen _ (n pps )! 


d r!i(n-—1)! 


. Si se tiene un conjunto con “n” elementos diferentes, 
todos los posibles grupos que se pueden formar, si se 


toman “r” elementos (para Y Sn ), tomando en cuenta el 
orden y sin reemplazo, es dado por: 


y" 0 n! 
"— (n—mn! 


Un caso particular, es cuando Y = MA , luego V=n! 


. Si se tiene un conjunto con “n” elementos diferentes, 
todos los posibles grupos que se pueden formar, si se 


toman “r” elementos (para Y <n ), tomando en cuenta el 
orden y con reemplazo, es dado por: 


r 


n 


. Si se tiene un conjunto con “n” elementos de los cuales 


n : n n 
son iguales, "2 son iguales,..., ” son iguales, donde 
12 


se cumple que Nin =1N, luego el total de permutaciones 
El 


para los “n” elementos es: 
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n| 


(MD (n2))...(np!) 


9.2. Condos o más conjuntos 


. Principio de la multiplicación 


Un acontecimiento puede ocurrir de “a “formas diferentes, otro de “b” 
formas diferentes, y así sucesivamente, hasta que un acontecimiento 
puede ocurrir de “m” formas diferentes; entonces el total de formas 
que puede ocurrir un acontecimiento completo (tomando un solo 
elemento de cada conjunto), es dado por: 


(aJb)...(m) 


. Principio de la_suma 


Un acontecimiento puede ocurrir de “a” maneras diferentes, otro de 
“b” maneras diferentes, y así sucesivamente, hasta que un 
acontecimiento puede ocurrir de “m” maneras diferentes. Suponiendo 
que los acontecimientos son mutuamente excluyentes(es decir si 
ocurre uno de los acontecimientos ya no pueden ocurrir otros); 
entonces cualquiera de los acontecimientos pueden ocurrir por la suma 
de las maneras; es decir, 


a+b+...m 


9.3. Ejercicios resueltos 


1. Un estudiante para ir a la Universidad nacional de ingeniería 
(UNI), dispone de 8 líneas diferentes del metropolitano o de 4 
líneas diferentes de microbús, de cuantas maneras diferentes se 
puede llegar a la UNI. 


Como los dos eventos son excluyentes(es decir si utilizo 
cualquier línea del metropolitano ya no podre usar cualquier línea 
de microbús y viceversa) el total de maneras es dado por la 
suma de cada acontecimiento: 

8+4=12 


2. Sean los dígitos (, 2,3, 4 $ se eligen 3 dígitos sin 
reemplazo, cuántos números de tres cifras se pueden formar. 
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Como el número a formarse es de tres dígitos, el primer digito se 
puede elegir de 4 maneras diferentes; como es sin remplazo el 
segundo digito se puede elegir de 3 maneras diferentes y por 
último el tercer digito se puede elegir de 2 maneras diferentes. 
Por lo tanto el total de números de tres dígitos que se pueden 
formar es dado por (460)=24 (principio de la 
multiplicación) 


V*t= 4! —4x3x2x1 
Por formula 3 (4 3) 1 


24 


Si la elección es con reemplazo, por el principio de la 
multiplicación (4)(4)(4)=64 


Por formula M' = A> = 64 


3.  Seanlos dígitos f 1,2,3,4,5,6,7, 8, 9h. se eligen 3 dígitos al 
azar y con reemplazo para formar un número. Hallar el total de 
números que se pueden formar en los siguientes casos: 


a. Formar todos los posibles números. 
Como las extracciones son con reemplazo, el primer, 
segundo y tercer digito pueden ocurrir de 9 formas diferentes, 
entonces por el principio de la multiplicación se tiene: 


9 9 9 


El total de formas diferentes de formar números con tres 
dígitos es dado por la multiplicación de 9x9x9=729. 


b. Formar números pares 
Un numero es par cuando la ultima cifra es par o cero, 
entonces el último digito puede ocurrir de 4 formas diferentes 
( 2,4,6,8) y como es con restitución el primer y segundo 
digito pueden ocurrir de 9 formas diferentes, entonces por el 
principio de la multiplicación se tiene: 


9 9 4 


220 


EsTADÍSTICa DESCRiptiva y prOBABILIDAd pARa LAs CIENCIAS DE LA INFORMAción CON El USO DE] spss 


El total de número pares que se pueden formar con tres 
dígitos es dado por la multiplicación de 9x9x4=324. 


c. Formar números mayores que 500 
El primer digito puede ocurrir de 5 formas diferentes para que 
sea mayor a 500 (5,6,7,8,9), y como es con restitución el 
segundo y tercer digito pueden ocurrir de 9 formas diferentes, 
entonces por el principio de la multiplicación se tiene: 
5 


El total de números que se pueden forman con tres dígitos 
mayores a 500 es dado por la multiplicación de 5x9x9=405. 


d. Formar números de tal manera que el digito 3 se encuentre 
en el centro. 
El primer digito puede ocurrir de 9 formas diferentes, el 
segundo digito puede solo ocurrir de una 1 sola forma 
(corresponde al número 3) y tercer puede ocurrir de 9 formas, 
entonces por el principio de la multiplicación se tiene: 
9 


El total de números que se pueden formar, de tal manera 
que el número 3 se encuentre en el centro es dado por la 
multiplicación de 9x1x9=81. 


4.  Seanlos dígitos f 1,2,3,4,5,6,7, 8, 9).se eligen 3 dígitos al 
azar y sin reemplazo para formar un número. Hallar el total de 
números que se pueden formar en los siguientes casos: 


a. Formar todos los posibles números 
Como las extracciones son sin reemplazo, el primer, segundo 
y tercer dígitos pueden ocurrir respectivamente de 9, 8 y 7 
formas diferentes, entonces por el principio de la 
multiplicación se tiene: 

9 8 7 


El total de números con tres dígitos es dado por la 
multiplicación de 9x8x7=504. 


b. Formar números pares 


Un numero es par cuando la ultima cifra es par o cero, 
entonces el último digito puede ocurrir de 4 formas diferentes 
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( 2,4,6,8) y como es sin restitución el primer y segundo digito 
pueden ocurrir de 8 y 7 formas diferentes, entonces por el 
principio de la multiplicación se tiene: 

8 7 


El total de número pares que se pueden formar con tres 
dígitos es dado por la multiplicación de 8x7x4=224. 


c. Formar números mayores que 500 
El primer digito puede ocurrir de 5 formas diferentes para que 
sea mayor a 500 (5,6,7,8,9), y como es sin restitución el 
segundo y tercer digito pueden ocurrir de 8 y 7 formas 
diferentes, entonces por el principio de la multiplicación se 
tiene: 


5 8 7 


El total de números que se pueden forman con tres dígitos 
mayores a 500 es dado por la multiplicación de 5x8x7=280. 


d. Formar números de tal manera que el dígito 3 se encuentre 
en el centro 
El primer digito puede ocurrir de 8 formas diferentes, el 
segundo digito puede solo ocurrir de una 1 sola forma 
(corresponde al digito 3) y el tercer puede ocurrir de 7 formas 
por ser sin restitución, entonces por el principio de la 
multiplicación se tiene: 


1 7 


El total de números que se pueden formar, de tal manera que 
el número 3 se encuentre en el centro es dado por la 
multiplicación de 8x1x7=56. 


5. En una reunión asisten 4 varones y 6 mujeres se elige 4 
personas sin tomar en cuenta el orden y sin restitución, cuantos 
grupos de personas se pueden formar en los siguientes casos: 

a. Todos los posibles grupos que se pueden formar. 
10 10! _ 
Cra =210 
4 4161 
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b. Todos los posibles grupos en la cual existan 3 varones y 1 
mujer. 
CFRC* SS DA 
3 1 
C. Todos los posibles grupos en la cual existan 2 varones y 2 
mujeres. 
C**C*=090 
2 2 
d. Todos los posibles grupos en la cual dos personas no 
aparezcan juntas 
CY -1*C$ =210- 28 = 182 
4 2 
6. En una urna contiene 2 bolitas rojas, 1 verde y 1 negra, se eligen 


4 bolitas sin reemplazo. Determinar el total de grupo a formarse 


E: 
Qanra»n 


9.4. Ejercicios propuestos 


1.  Seanlos dígitos £0,1,2, 3,4,5,6,7, 8, 9). se eligen 4dígitos 
al azar y con reemplazo para formar un número. Hallar: 


a. ¿Cuántos números pares se pueden formar. 
b. ¿Cuántos números son mayores a 5000. 
C. ¿Cuántos números son menores que 7000. 
d ¿Cuántos números son mayores a 3000 pero menor a 
8000. 
e. ¿Cuántos números son mayores a3500. 
f. ¿Cuántos números contienen al digito 5. 
2. En un estante existe 3 libros de historia, 4 de literatura y 2 de 


música, se eligen 2 libros sin reemplazo. Hallar todas las 
posibles combinaciones. 
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+ 


En una reunión asisten 5 varones y 3 damas, se elige 2 personas 
al azar. Hallar todas las posibles combinaciones. 


Un bibliotecólogo para codificar revistas científicas dispone de 


los siguientes dígitos (0,1,2,3 4,5,6,7,8,9 $, de cuantos códigos 
de 4 dígitos se dispone en cada caso: 


a. Se toma en cuenta el orden y con reemplazo 
b. Se toma en cuenta el orden y sin reemplazo 
C. No se toma en cuenta el orden y sin reemplazo 


Un cliente del Banco de la Nación tiene la posibilidad de escoger 
4 de los siguientes 10 dígitos [ 0,1,2,3,4,5,6,7,8,9) como clave 
de su tarjeta Multired, Hallar todas las posibles combinaciones 
bajos las siguientes restricciones: 


a. Esta permitido elegir un mismo digito( elección con 
reemplazo) 

b. No esta permitido elegir un mismo digito( elección sin 
reemplazo) 

C. Que el número elegido sea par( con reemplazo y sin 
reemplazo) 

d. Que el número elegido sea impar( con reemplazo y sin 
reemplazo) 

e. Que el número elegido sea superior a 5000( con 
reemplazo y sin reemplazo) 

hi Que el número elegido sea inferior a 5000( con reemplazo 
y sin reemplazo) 

9. Que el número elegido se encuentre entre 5000 y 8000( 
con reemplazo y sin reemplazo) 

h. Que el primer digito sea 4( con reemplazo y sin 
reemplazo) 


l Que el último digito sea 4( con reemplazo y sinreemplazo) 
[$ Que el segundo digito sea O( con reemplazo y sin 
reemplazo) 


En una reunión de una prestigiosa empresa dedicada a la 
producción de llantas para automóviles asisten 12 varones y 8 
mujeres, después de acaloradas discusiones se desea formar 
una comisión para analizar la estrategias de ventas: Dicha 
comisión debe estar integrada por 5 personas. Hallar todas las 
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posibilidades de elegir a las 5 personas bajo las siguientes 
condiciones. 


Elegir a cualquiera de ellos 

Que todos sean del sexo varón 

Que todos sean del sexo mujer 

Que haya 3 varones y 2 mujeres 

Que una mujer presida el grupo 

Que un varón presida el grupo 

Que una mujer este excluida del grupo 
Que un varón este excluido del grupo 


TOP 2Lo op 


8. En una urna hay 4 bolas blancas, 5 rojas y 3 amarillas, se 
selecciona en forma aleatoria 5 bolas, cuantas formas existen 
de elegir las 5 bajo las siguientes modalidades: 


a. 2 sean blancas y 3 de otro color, sin reemplazo y sin 
considerar el orden de extracción. 

b. 3 sean blancas y 2 de otro color , con reemplazo y sin 
considerar el orden de extracción 

C. 2 sean amarillas y 3 de otro color, con reemplazo y 


considerando el orden de extracción. 


9. Una persona para llegar a cierta ciudad tiene que hacer uso de 
los siguientes medios de transportes; tiene 3 líneas de ómnibus 
para llegar a determinado paradero y 4 líneas de ómnibus para 
llegar al paradero final. ¿De cuántas formas diferentes puede 
llegar al paradero final?. 


10. En una urna existen 4 bolas rojas y 3 bolas blancas, se elige al 
azar 3 bolas con reemplazo. ¿Cuántas formas diferentes existen 
de elegir las 3 bolas?. 


11. —Enuun estante existen 5 libros de física de diferentes autores, 4 
de matemáticas de diferentes autores y 3 libros de químicas de 
diferentes autores. ¿ cuantas formas existen de elegir tres libros 
de diferentes materias?. 


12. De la pregunta anterior, Hallar las formas de elegir tres libros al 
azar con reemplazo. 


13. De la pregunta 10, Hallar las formas de elegir tres libros al azar 
sin reemplazo. 
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14. 


15. 


16. 


17. 


18. 


De la pregunta 10, Hallar las formas de elegir tres libros al azar 
sin con reemplazo, si un libro de física siempre debe aparecer en 
el centro. 


De la pregunta 10, Hallar las formas de elegir tres libros al azar 
con reemplazo, si un libro de física siempre debe aparecer en el 
centro. 


En una biblioteca concurren 50 alumnos, de los cuales 30 son 


varones, so eligen al azar £lumnos, de cuantas formas se 
pueden elegir 5 varones y 5 damas. 


Sean los dígitos £1, de 3 4 1 se eligen 3 dígitos 
sin reemplazo, cuántos número de tres cifras menor o igual a 
231 se pueden formar 


En una biblioteca concurren 50 alumnos, de los cuales 30 son 


varones, se eligen al azar 10 alumnos, de cuantas formas se 
pueden elegir 6 varones y 4 damas. 
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CAPÍTULO 10 
PROBABILIDAD 


INTRODUCCIÓN 


En este capítulo se presentan las bases, para modelar situaciones 
donde interviene incertidumbre en la toma de decisión para un 
conjunto de datos observados. 


10.1. 


EXPERIMENTO ALEATORIO (€) 
Es una operación física o idealizada, cuyo resultado de la 
observación no se conoce con exactitud, hasta después que 


culmine el experimento. El experimento deja de ser aleatorio 
cuando este concluye y se observa el resultado. 


Ejemplos. 


€; =Elegir dos bolitas de una urna que contiene 1 bolitas rojas y 
1 blancas. 


e 2 =Lanzar una moneda dos veces y observar su resultado 


€ 3 =Registra el tiempo (horas) de vida de un foco eléctrico y 
observar su resultado. 


€ 4 = Lanzar una moneda hasta que aparezca la primera cara. 


€ 5 = Registra el peso (Kg.) de un recién nacido. 


Características de un experimento aleatorio. 


a. Puede ser repetido infinita veces, bajo las mismas 
condiciones 
b. Los resultados posibles de un experimento, se pueden 


conocer a priori; Es decir se puede enumerar todos los 
posibles resultados del experimento aleatorio. 

G: Para un experimento aleatorio es casi siempre posible 
establecer un modelo probabilístico. 
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10.2. ESPACIO MUESTRAL ((2) 
Es el conjunto de todos los posibles resultados de un 
experimento aleatorio y es denotado por (QA) y al total de 
resultados se denota por n((Q) 


Ejemplos: 


€] = Elegir dos bolitas de una urna que contiene 1 bolitas 
rojas y 1 bolitas blancas y anotar sus resultados. 


Q¡= (RR, RB, BR, BB y 
€ 2— Lanzar una moneda dos veces y anotar sus resultados 
(0),= f (cc) (cs), (sc), (ss) , 
€3 - registra el tiempo (horas) de vida de un foco eléctrico. 
O3=4(1/t, 1>0) 
€ 4 = lanzar una moneda hasta que aparezca la primera cara. 
O4= fe, SC, SSC, SSSC, SSSSC,... y 
€ 5 = Elegir a un recién nacido y registrar su peso (Kg.) 


Os = Íx/x= peso, 1.5 <x<4.1) 


10.3. TIPOS DE ESPACIO MUESTRAL: 
ESPACIO MUESTRAL DISCRETO 
Si el espacio muestral tiene un número finito o infinito 
numerable de elementos. 


Ejemplo: 
Son los espacios muéstrales Q,, y O, 
ESPACIO MUESTRAL CONTINUO 


Si el espacio muéstral tiene un número infinito no numerable de 
elementos. 


228 


EsTADÍSTICa DESCRiptiva y prOBABILIDAd pARa LAs CIENCIAS DE LA INFORMAción CON El USO DE] spss 


Ejemplos: 
Son los espacios muéstrales O, > O, > O, 


10.4. EVENTOS O SUCESOS 
Es un subconjunto del espacio muéstral, o es el conjunto de 
todos posibles resultados que le interesa en forma particular al 
investigador. A los eventos se le representa por lo general con 
las primeras letras mayúsculas del abecedario o también con 
letra mayúscula acompañada con subíndice. 


Ejemplo: 
De los 5 espacios muéstrales anteriores se definen los 
siguientes eventos: 


A = Que el número de artículos sea mayor a 5. 

B = Obtener una cara en los dos lanzamiento. 

C = Que el tiempo de vida se encuentre entre 980 horas y 
1200 horas 

D = Que ocurra cara en el 5to. Lanzamiento. 

E = Que el peso del recién nacido se encuentre entre 2.5 y 3.4 
Ko. 


10.5. EVENTOS MUTUAMENTE EXCLUYENTES 


Sean A y B dos eventos definidos en el espacio muestral Y , Se 
dice que los eventos son mutuamente excluyentes, si y solo si, 
estos no pueden ocurrir simultáneamente; es decir si el evento 
“A” ocurre, y no ocurre el evento B 


(viceversa); se representa matemáticamente por: A NB =D 


A 
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Ejemplo 


Lanzar un dado dos veces, sean los eventos 
A = Que la suma de sus puntos sean 7 
B = Que la suma de su puntos sean 11 


Luego los eventos A y B son mutuamente excluyentes; es decir 
si ocurre el evento A ya no ocurre el evento B, y viceversa. 


TIPOS DE EVENTOS 


10.6. EVENTOS SIMPLES 


Son aquellos eventos que tienen un solo elemento del espacio 
muestral 


Ejemplo 


€ 3 = Lanzar un dado dos veces. 


(1 2,1 31 4,1 5,1 61 ) 
122% 39 42 52 62 
13 23 33 43 53 63 
14 24 34 44 54 da] 
[A 2535 49 559001 
16 26 36 46 56 66) 


Sea el evento simple: 


A = Que la suma de los resultados sea 2= £(1,D) 


10.7. EVENTOS COMPUESTOS 
Son aquellos, eventos que tienen mas de un elemento del 


espacio muestral 
Ejemplo 


Del ejemplo anterior del lanzamiento de dos dados 
A = Que la suma sea 7= 1(3,4),(4,3),(2,5),(5,2(6,1),(1,6) 
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10.8. EVENTOS NULOS O VACIOS 
Son aquellos eventos que no tiene elementos del espacio 
muestral 
Del ejemplo anterior del lanzamiento de dos dados 


A = Que la suma sea13=1 )= (0) 


10.9. EVENTOS IGUALMENTE PROBABLES: 
Dos o más eventos simples son igualmente probables, si tienen 
la misma probabilidad de ocurrir. 


Ejemplo-1 


Se lanza un dado dos veces, los 36 eventos simples de la 
forma ( x, y) son igualmente probables; es decir cada evento 
simple tiene la misma oportunidad de ocurrir. 


Ejemplo-2 


Una urna contiene 8 bolas rojas y 2 bolas blancas, se elige una 
bola al azar, los eventos simples serán cada uno de los 
resultados posibles en este caso roja o blanca, notamos que la 
probabilidad de sacar bola roja es más probable que sacar bola 
blanca, entonces los eventos simples no son igualmente 
probables. 


10.10. DEFINICIÓN CLÁSICA DE PROBABILIDAD 


Es la manera más antigua de calcular probabilidades de eventos 
igualmente probables. 
Sea € , un experimento aleatorio, y (2 su espacio muestral, con 


N(QO) resultados igualmente probables. Sea A un eventos 


definido en Y , con 
N(A) Resultados igualmente probables; la probabilidad de 
que ocurra el evento A denotado universalmente por P(A), es un 


número positivo definido por: 


NA) _ 


P(A)= N ?de elementosdel evento A 


nO)  Nde elementosdel espaciomuestral S 
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Ejemplo 1 


Del ejemplo de lanzar un dado dos veces, cual es la 
probabilidad de que la suma de sus resultados sea siete. 


Sea el evento A = La suma de los resultados de lanzar un 
dado dos veces sea siete. 


A= 16,4),(4,3),(2,5),(5,216,1),(1,6) entonces n(A)=6 


Como N(S )=36, corresponde a todos los resultados posibles 
al lanzar un dado dos veces. 


P(A)= 1) = N *de elementosdel evento A = 6 = l = 0.1667 


nO)  N de elementosdel espaciomuestral S 36 6 


Interpretación: 


La Probabilidad de obtener la suma de los resultados 7 cuando 
se lanza un dado dos veces es 0.1667 o el 16.67%. 


Ejemplo 2 


A una reunión asisten 30 varones y 40 mujeres, se eligen a 10 
personas al azar sin reemplazo. Hallar las siguientes 
probabilidades: 


a) Elegir 6 varones y 4 mujeres 
b) Elegir por lo menos 4 varones 


Solución para (a) 


S = Todas las posibles formas de elegir 10 personas de un 
total de 70, sin reemplazo: 


N(O)=CP 


Sea el evento A de interés, todas las formas posibles de elegir 
6 varones y 4 mujeres de un total de 70 personas, es dado 
por: 
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N ( A) E CACA 
6 4 


Cc 7 
nd) - € “4_0.1368 
n(90) Ci 


Luego P(A)= 


Solución para (b) 

Sea el evento B elegir por lo menos 4 varones, significa que 
en el grupo de 10 personas elegidas, deben haber 4 varones y 
6 mujeres; 5 varones y 5 mujeres; 6 varones y 4 mujeres; 7 
varones y 3 mujeres; 8 varones y 2 mujeres; 9 varones y 1 
mujeres o 10 varones. 


N(G5) = CPC + CE Aa G ie 404 € “E da 6 Cc M4, C YE 4, C 30 
CCP COCO 
n(B) — P 


SS E 1 =0:702052255 
n(0) Ci 


P(B)= 


10.11. DEFINICIÓN FRECUENCIA RELATIVA DE PROBABILIDAD 


Si un experimento aleatorio se repite n veces bajo las mismas 


condiciones y si Ma de esas veces que se repite el experimento 
ocurre el evento de interés A. Luego la frecuencia relativa del 
evento A es: 


n 
—"A 
ha es 
n 
En el límite de las veces que se repite el experimento, la 
probabilidad de ocurrencia del evento A es: 


= Li Pa 
Limh, 7 1 =PCA) 


n—>o 
n—>0o0 


La probabilidad, es el valor en el cual se estabiliza la frecuencia 
relativa del evento después de haber repetido un número grande 
de veces. 
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10.12. 


Ejemplo 


Suponiendo que en una garita de peaje transitan casi siempre 
durante el día 8,000 vehículos, de los cuales 4,000 son autos, 
2,500 son camiones y 1,500 corresponde a ómnibus. 


Tipos de vehículos Frecuencias Frecuencia relativa 
Autos 4000 0.5000 
Camiones 2500 0.3125 
Omnibus 1500 0.1875 
Total 8000 1. 000 


¿Cuál es la probabilidad de que pase por la garita de peaje un 
camión?. 


Sea el evento A = que pase un camión por la garita de peaje, 
luego: 


P(A)= de =0.3125 


8000 


¿Cuál es la probabilidad de que pase por la garita de peaje un 
camión o ómnibus?. 


Sea el evento B = que pase un camión o ómnibus por la garita 
de peaje, 


2500+1500_ , < 
8000 


DEFINICIÓN AXIOMATICA DE PROBABILIDAD 

Sea € , un experimento aleatorio y (2 su espacio muestral 
asociado al experimento; sea A un evento de interés definido en 
el espacio muestral, la probabilidad de que ocurra el evento A, es 
un número real positivo denotado por P(A), que cumple los 
siguientes axiomas: 


P(A) = 


a. 0O< P(A)<1 
b. P(O) =1 
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C. SeanA; y A, eventos mutuamente excluyente 
definidos en 5, entonces se cumple que: 


P(A¡0A,) = P(A¡V A,) = P(A,) + P(A,) 


El axioma (c) se generaliza para más de dos eventos 
mutuamente excluyentes, siempre y cuando que sean 
excluyentes dos a dos. 


Los tres axiomas son las bases para los siguientes teoremas: 


1. Sid, eselconjunto vacío, entoncesla P(p )=0 
Demostración 
Sea A un evento definido en el espacio muestral (2, entonces 
se cumple que: AU(=A, pero A y (Q, son eventos 
mutuamente excluyentes; es decir A A q = q), haciendo uso 
del axioma (c), se tiene que: 


P(AUQ)=P(A)+P($)=P(4) > P()=0 


2. Sea A' un evento complemento del evento A entonces se 
cumple que: 
P(A“)=1-P(A) 


3. Sean A y B dos eventos definidos en el espacio muestral Ss ; 


supongamos que A < B, entonces se cumple que: 
P(A)<P(Bb) 


4. Sean A y B dos eventos cualesquiera definidos en el espacio 
muestral (., entonces se cumple que, la probabilidad de que 
ocurra el evento A o el evento B o ambos a la vez A y B es dado 
por: 

P(AUB)=P(A)+P(B)-P(ANMB) 
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Ejemplo 


Sean los dígitos: La 3,4,5,6,7, 8, 9 : se elige un dígito al azar. 
Calcular las siguientes probabilidades: 


a. Que el número elegido sea menor a 4 o superior a 7. 
b. Que el número elegido sea par o superior a 6. 
C. Que el número elegido no sea 4 


Solución para (a) 


Sean los eventos A=que el numero elegido sea menor a 4 ; B= que el 
numero elegido sea superior a 7, luego: 
A=41,2,3) 
B=18,9, ) 
Como los eventos A y B son mutuamente excluyentes, luego: 
P(AUB)=P(A)+P(B)="+%=" 
9.9. 9 
Solución para (b) 
Sean los eventos A=que el número elegido sea par; B=que el número 
elegido sea superior a 6, luego: 
A=42, 4, 6, 8,) 


B=4(7,8,9) 
Como los eventos A y B no son mutuamente excluyentes, luego: 
P(AUB)=P(A)+P(B)-P(ANMB) 


La intercepción de A y Bes 
AMB= (8) 


PLAOB)=P(A)+PB)-PANB= "+ === 
999 9 3 


31.6 2 


Solución para (c) 
Sean los eventos A=que el número elegido sea 4 y su complemento 


Cc 
A - que el número elegido no sea 4: 
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A=(4) 
P(Ac)=1-P(4)=1-! = 
9. 9 9 


10.13. PROBABILILIDAD CONDICIONAL 


9-1 8 


Sea A y B dos eventos definidos en el espacio muestral (Q . 

Supongamos que el evento B ya ocurrió. ¿Cuál es la probabilidad de 

que ocurra el evento A?. El valor de la probabilidad pedida se 

representa universalmente por P(A / B), y es definida por: 

P(AANB) 

PAIB)=_" para P(B)>0 
P(B) 


LaP(A/B), cumple con los 3 axioma de probabilidad. 


Ejemplo: 


Un centro de información tiene 11,590 revistas científicas, las cuales 
están clasificadas según la materia y su idioma. 


Materias 
Matemáticas Física Química Total 

Idiomas 

Inglés 1200 900 850 2950 
Portugués 700 1500 900 3100 
Español 1000 980 1200 3180 
Francés 800 970 590 2360 
Total 3700 4350 3540 11590 


Se elige una revista al azar y supongamos que la revista esta escrita 
en inglés, ¿cuál es la probabilidad de que sea de física?: 

Sean los eventos: 

A= revistas de física 

B= revistas ee en inglés 

ET 


PB) 
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De la tabla: 


La probabilidad de que sea de física y escrito en inglés: 
P(ANB)= 


11590 
La probabilidad de que este escrito en inglés: 
P(B)= 2950 
11590 
Luego: 


P(ANB) 
PCarB)=" = % - 030508 
P(B) 2950 


Otra forma de obtener este resultado: 


Como el evento B ya ocurrió, el espacio muestral original conformado 
por la 11,590 formas de elegir una revista con esas dos características 
se reduce a solo 2,950 revista escritas en inglés, de las cuales 900 
están en ingles, entonces: 


90 
P(A/B)= _-0(0.30508 
2950 


10.14. REGLA DE LA MULTIPLICACIÓN DE PROBABILIDADES 


De la probabilidad condicional 
_P(ANB) 
HD gy PAPA 


También se tiene que la probabilidad de que ocurra el evento B 
suponiendo que ya ocurrió el evento A, es dado por: 
PBNOA) 
P(B14)=_" " > PBOA)=PA)PBIA) Q) 
P(A) 
De 1 y 2 se tiene que: 
P(AN B)=P(BIP(A / B)= P(AJP(B / A) 
Ejemplo 


Del ejemplo anterior, se eligen al azar y sin reemplazo dos revistas, 
calcular las siguientes probabilidades: 
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10.15. 


Que la primera revista sea de física y la segunda de física ( 
equivale decir también a que ambas sean de física) 


Sean los eventos: 
A=Elegir una revista de física 
B=Elegir una revista de física 


PAN B)=P(A)JP(B/A)= 48350 y 4349 - 0140847539 
11590 11589 
También: 
4350 
P(Ambas revistasseande fisica) =_ ?...=0.140847539 
d 2 
Que la primera revista sea de física y la segunda de matemática 


Sean los eventos: 
A=Elegir una revista de física 
B=Elegir una revista de matemática 


PAN B)=PAP(B/A)= 4350 , 3700 _ 011983 
11590 11589 


Del ejemplo anterior supongamos que se eligen tres revistas al 
azar y sin reemplazo, cual es la probabilidad de que la primera 
revista este en idioma inglés, la segunda en idioma inglés y la 
tercera en idioma español. 


Sean los eventos: 

A=Elegir la primera revista en idioma ingles 
B=Elegir la segunda revista en idioma ingles 
C=Elegir la tercera revista en idioma español 


PLADBOC) = P(A)P(B/A)JP(CIANB)= 2950 y 2949 y 3180 _ (01777 
11590 11589 11588 


REGLA DE LA MULTIPLICACIÓN PARA MAS DE DOS 
EVENTOS CUALESQUIERA 


Sea Aj, Az,....A, eventos definidos en el espacio muestral $, 
entonces la probabilidad de que ocurran todos estos eventos en ese 
orden es dato por: 


239 


EsTADÍSTICa DESCRiptiva y pROBABILIDAd pARa LAs CIENCIAS DE LA INFORMAción CON El USO DE] spss 


P(A¡1DA20,.... An) =PC(A1)PCAS2/A)PCAS/ AI A2),..., PCAn/ ALMA»)... MAn-1) 
Con la condición deque P(A1142,... MAn-1)>0 


5. PARTICIÓN DEL ESPACIO MUESTRAL 


Sea A,, A, mm. e eventos mutuamente excluyentes definidos en el 


espacio muestral (2, entonces E A constituyen una 
partición, si cumplen las siguientes condiciones: 


1. Ai=Q0 Vi 
2. A¡NAj=0 Via y 
3. AJUVA2U... UAn) =(2 


Aj A) A3 iS An 


10.16. TEOREMA DE LA PROBABILIDAD TOTAL 


Sea Ay, A,,....A, una partición del espacio muestral, definimos en 
estas particiones otro evento tal como B, luego se cumple que: 


B 


La probabilidad de que ocurra algún elemento de B es dado por: 


P(B)=Y PA, OB) 
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Demostración: 


Del GRÁFICO: 


B=(A1NB)U(A2 NB) U... U(An NB) : por ser estas 


intercepciones (A¡A1 B) mutuamente excluyentes para  V;¡luego se 
cumple que: 


n 


P(B) =P(A1OB)+P(A2 NB) +...P(B An) =P, PAI B) 


10.17. TEOREMA DE BAYES 


Sea A¡, A,,....A, una partición del espacio muéstral, definimos en 
esta partición otro evento B, entonces la probabilidad de que ocurra un 


evento A; suponiendo que ocurrió el evento B, es dado por: 


P(A IB) PAN B)- PLA)PB LA) PCA)PIBIA)  ¡=123,..n 
' P(B) P(B) 


n 


Y PCADPB /A) 


i=1 


Ejemplo 


Un fabricante de chompas produce en un día determinado 1000 
chompas; 300 son para varones, 250 para mujer y 450 para niños: La 
probabilidad de que una chompa de varón tenga falla en el tejido es de 
0.01, para mujer es de 0.025 y para niños es de 0.05; de la producción 
de ese día se elige una chompa al azar; Hallar las siguientes 
probabilidades: 


1. Que la chompa tenga falla 
Que la chompa no tenga falla 


Supongamos que se elige una chompa y tiene falla. ¿Cual es la 
probabilidad de que sea de varón? 


De la información se tiene: 
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Sean los eventos: 
A =chompa de varón 


A2 =chompa de mujer 

A3 =chompa de niño 

B = chompa con falla 

Del enunciado se tiene las siguientes probabilidades: 
300 

P(A¡))= =——=0,3 
1000 


P(A,)= a 0.25 
1000 


Pay 01 
1000 


P(B/A1)=0.01 
P(B/A2)=0.025 
P(B 1 A3)=0.05 


La probabilidad pedida es: 


P(B)= P(A1)P(B/A1)+ PCA2)P(B 142) +PCA3)P(B /A3) 
P(B) = 0.3 * 0.01+ 0.25* 0.025 + 0.45* 0.05 = 0.032 
Interpretación: 


Existe una probabilidad del 0.032 o 3.2% de elegir una chompa de la 
fábrica y que tenga falla. 


La probabilidad pedida es: 


P(B"“)= 1 -—P(B) =1-0.032=0.968 o 96.8% 
La probabilidad pedida es: 


= 0.094 


P(A y gy POB) _ PCADP(B/A1) _ 0.3 0.01 
j P(B) P(B) 0.032 
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10.18. INDEPENDENCIA DE EVENTOS 


Sean A y B dos eventos definidos en el espacio muestral (2, se dice 
que el evento A es independiente del evento B, si la probabilidad de 
ocurrencia del evento A, no se ve afectado por la ocurrencia del evento 
B y viceversa; es decir, 


P(A/B)=P(A) o P(B/A)=P(5b) 


Por lo tanto, si los eventos A y B son independientes, entonces: 


P(de que ocurra los eventos A y B en forma simul tan ea) = P(AyB)=P(A NB) 
- P(A).P(B) 
Teoremas 


Sean A y B dos eventos independientes definidos en (2, sean los 


A” B* 
eventos y sus complementos respectivamente, luego 
se cumplen los siguientes teoremas: 


1. P(ASOB)=P(ADP(B) 
2. PANB")=P(A)P(B") 
3. MA OB)=P(A)P(B') 


Demostración de (3) 

A“ MB" =(AUB)" Por la Ley de Morgan 
P(AOB)=P(AUB)=1-P(AUB)=1-P(A) -P(B)+P(A MB) 
P(A“OB")=1-P(A) -P(B) + PCAJP(B) 
PAAB")=(1-PCA)) — P(BIA— PCAY) 


PCAS O Bo) =(1- PCAYA— P(B)) =P(AC)P(B >) 
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Ejemplo 
Se tiene dos urnas la primera contiene dos bolas rojas y una bola 
blanca, la segunda urna contienen una bola roja y dos bolas blancas, 


se elige una bola de cada urna. ¿Cual es la probabilidad de ambas 
bolas sean del mismo color. 


M= Obteneruna bola roja = ÍR ) 
N= Obteneruna bola blanca = ÍB) 


Por ser ambos eventos independientes, luego: 
Sea el evento de interés: 


A=(ÍRR o BB) 
P(A)=P(ÍRR o BBj)=P(RR)+P(BB)= P(R).P(R)+P(B).P(B) 


Por ser eventos mutuamente excluyentes y a la vez eventos 
independientes, luego se tiene: 
E 3 El. 0 dl 


P(A)=PRD).PR)+PB)PB)= * 0 +_ _=0,44444 
3333 9 

10.19. EJERCICIOS PROPUESTOS 

1. Una caja contiene 8 bolsas de detergentes marca A y 5 bolsas 


de detergente marca B, se extraen al azar y con reemplazo 4 
bolsas. ¿ Cuál es la probabilidad de que sean extraídas 3 bolsas 
del detergente A y 1 bolsa del detergente B? 


2. En una reunión asisten 12 varones y 8 damas, se selecciona al 
azar 5 personas. ¿Cuál es la probabilidad de que 3 sean damas. 


3. En una ciudad hay 3 vendedores de gas(A; B y C). Un día 5 
residentes llaman a un vendedor de gas. Si cada residente 
selecciona al azar al vendedor de gas. 


a. ¿Cuáles la probabilidad de que todos los vendedores de gas 
sean elegidos. 

b. ¿Cuál es la probabilidad de que solo 2 vendedores de gas 
sean elegidos. 
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Cc. ¿Cuál es la probabilidad de que solo vendedores de gas A y B 
sean elegidos. 


4, Se tienen los dígitos [ 1,2,3,4,5,6,7,8,9) , se elige 3 dígitos al azar 
y con reemplazo. Hallar las siguientes probabilidades: 


Que el número elegido sea par 

Que el número elegido sea impar 

Que el número elegido sean mayor a 400 

Que el número elegido se encuentre entre 300 y 600 

Que el número elegido contenga al número 5 en el centro 
Que el número elegido contenga al número 5 al inicio 
Que el número elegido contenga al número 5 al final 


O 7DOaoTp 


5. Del ejemplo anterior Hallar las probabilidades para el caso de 
elegir los 3 dígitos al azar y sin reemplazo. 

6. Si los dígitos [2,2,2,5,5,7,8), se distribuyen al azar para formar un 
número de 7 cifras. ¿ Cuál es la probabilidad de que el numero 
formado se encuentren los dígitos 5 juntos?. 

7. Una caja contiene 4 focos malos y 6 buenos, se sacan dos a la 
vez, si se prueba uno de ellos y se encuentra que es malo: ¿Cuál 
es la probabilidad de que el otro también sea malo? 

8. En un hotel se hospedan 6 arequipeños y 4 huanuqueño. Se 
elige en forma aleatoria a 3 personas del hotel. ¿Cuál es la 
probabilidad de que al menos un de ellos seaarequipeño? 

9. El gerente de una tienda comercial de dedicada a la venta para 
varones, toma una muestra aleatoria de 200 clientes y lo 
organiza de acuerdo a la siguiente tabla de doble entrada, tal 
como se muestra: 


CLIENTES COMPRANA | COMPRANAL | TOTAL 
CREDITO CONTADO 
CON TARJETA 80 40 120 
DE CREDITOS 
SIN TARJETA 50 60 110 
DE CREDITOS 
TOTAL 130 100 230 


a. ¿Cuál es probabilidad de que no tenga tarjeta de crédito o 
compre a crédito? 

b. ¿Cuál es la probabilidad de que tenga tarjeta de crédito y 
compre a crédito? 
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Cc. Si se sabe que tiene tarjeta de crédito. ¿Cuál es la 
probabilidad de que compre a crédito? 

d. Se seleccionan a 3 clientes a azar, sin reemplazo. ¿Cuál es 
la probabilidad de que al menos uno compre al contado? 

e. Se seleccionan a 3 clientes al azar con reemplazo. ¿ Cuál es 
la probabilidad de que 2 tengan tarjetas de crédito? 


Una compañía de cerveza tiene dos lavadoras de botellas. La 
lavadora “A” procesa un 20% de todas las botellas utilizadas 
diariamente y rompe un 3% de las que lava. La lavadora “B” 
procesa las restantes y rompe un 4%. 


a. ¿Cuál es la probabilidad de que una botella lavada, 
seleccionada al azar este rota? 

b. Una botella lavada seleccionada al azar, está rota. ¿Cuál a 
probabilidad de que haya sido lavada en la lavadora “A”?, 

c. Una botella lavada seleccionada al azar, no está rota. ¿Cuál 
es la probabilidad de que haya sido lavada por la lavadora 
“AN”? 


Una base de datos contiene 50 libros de física y 20 de química y 
30 de matemáticas, se eligen al azar 5 libros. Hallar las 
siguientes probabilidades. 


a. Que 3 sean de Matemática y 2 de Química. 

b. Que 2 sean de Química, 2 de Matemática y 1 de Física. 

c. Que los 5 sean de Matemática. 

d. Que 3 sean de Matemática y 2 de Física o los 5 sean de 
Matemática 

e. Que los 5 libros sean de Física o 5 sean de Química. 

f. Que los 5 sean de Matemática o 5 de Química o 5 de Física. 


Sean los dígitos: 1, 2, 3, 4, 5, 6, 7, 8, 9, se eligen tres dígitos al 
azar con reemplazo para formar un número. Cuál es la 
probabilidad de que el número formado sea par o mayor a 500. 


Una primera base de datos contiene 10 revistas de computación 
y 10 de física, otra segunda base contiene 8 de computación y 
12 de física. Se elige una revista de cada base de datos. Calcular 
las siguientes probabilidades. 


a. Que sean de la misma materia 
b. Que sean de diferentes materias 
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